Blog Multimodal LLMs & Texto

Multilingual Hematology Visual Question Answering Dataset

arXiv:2606.25246v1 Announce Type: new Abstract: Vision Language Models (VLMs) have shown promising capabilities in medical image analysis by jointly understanding visual and textual information for tasks such as Visual Question Answering. However, existing hematology vision-language resources remain predominantly English centric, limiting their applicability in multilingual healthcare environments. This challenge is releveant generally to South Asia and specifically to Pakistan, where Urdu is wi...

arXiv cs.CV ·Hajra Malik, Hafiza Tooba Aftab, Abdul Rehman, Mohsen Ali, Waqas Sultani · 25 de janeiro de 2026

Ver no Hugging Face

// relacionados

Multilingual Hematology Visual Question Answering Dataset

Leia também

JoyAI-VL-Interaction: o primeiro modelo aberto que assiste, decide quando falar e delega

RigPI: Dynamic Parameter Identification of Rigid Body via VLM-Seeded Differentiable Simulation

Cross-Modality Structural Guidance in 3D Latent Diffusion for Robust FLAIR Super-Resolution

fARfetch: Enabling Collocated AR-HRC in Large Visually Diverse Environments with VLM-Driven AR Content Adaptation