DataSalon

Discover quality datasets for AI training — aggregated from 40+ platforms, curated by AI.

ProductSearch Datasets Browse Topics Rankings Community API / MCP

ResourcesDocumentation Blog Changelog Status

LegalPrivacy Policy Terms of Service Cookie Policy

AgentClinic MedQA: Multimodal Agent Benchmark for Clinical Simulation | DataSalon

Home Multimodal & LLMAgentClinic MedQA: Multimodal Agent Benchmark for Clinical Simulation

Multimodal & LLM

AgentClinic MedQA: Multimodal Agent Benchmark for Clinical Simulation

Name: AgentClinic MedQA: Multimodal Agent Benchmark for Clinical Simulation
Creator: katielink
Published: 2024-05-16T05:44:44
Keywords: Size Categoriesn1 K, Modalitytext, Librarymlcroissant, Modalityimage, Librarydatasets, Regionus, IMAGEFOLDER

by katielink·Updated 2y ago

Available on 1 platform

Description

This multimodal agent benchmark evaluates AI performance within simulated clinical environments using language agents. It adapts the MedQA dataset to facilitate interactive diagnostic reasoning between AI doctors and simulated patients across various medical scenarios.

Use Cases

Evaluate the diagnostic accuracy of AI agents within a simulated patient-doctor dialogue
Benchmark the clinical reasoning capabilities of GPT-4o using the AgentClinic framework
Analyze the interaction efficiency of language models in gathering medical history from simulated patients

Strengths

Multimodal benchmark architecture for evaluating AI agents in clinical settings
Support for GPT-4o and HuggingFace model integration
Simulated clinical environment based on the MedQA (USMLE) dataset
Focuses on interactive diagnostic reasoning through simulated patient-doctor dialogues

IMAGEFOLDER Size Categoriesn1 K Modalitytext Librarymlcroissant Modalityimage Librarydatasets Regionus

Related Datasets

Quality Score

D34

Description

Source

Reputation

Quality Score

D34

Description

Source

Reputation

Access

Community

86 downloads

2 likes

0 views

Dataset Info

Author: katielink
Created: May 16, 2024
Updated: Jun 20, 2024

Access

Community

86 downloads

2 likes

0 views

Dataset Info

Author: katielink
Created: May 16, 2024
Updated: Jun 20, 2024

AgentClinic MedQA: Multimodal Agent Benchmark for Clinical Simulation

Description

Use Cases

Strengths

Related Topics

Related Datasets

Quality Score

Community

Dataset Info

Community

Dataset Info