--- language: - tr - en tags: - llava - llava-med - turkish - translation - vqa - mistral - image-to-text - medical - radiology - multimodal license: apache-2.0 datasets: - mimic-cxr inference: true library_name: transformers pipeline_tag: image-to-text widget: - src: "example-xray.jpg" example_title: "Örnek: Akciğer Röntgeni" inputs: text: "Bu görüntüde anormallik var mı?" --- --- # 🇹🇷 Turkish LLaVA-Med Pipeline (v1.5 - Mistral 7B) Bu model, Microsoft tarafından geliştirilen **LLaVA-Med v1.5 (Mistral 7B)** mimarisini temel alır ve Türkçe dil desteği ile tıbbi görüntüler üzerinden görsel soru-cevaplama (VQA) gerçekleştirmek üzere özelleştirilmiştir. ![image/png](https://cdn-uploads.huggingface.co/production/uploads/66d27a34d51528a038d1d50c/0vWjZ0SaA0tFHIVIYTE2I.png) ## 🧠 Özellikler - Görüntü tabanlı analiz (X-ray, MR, vb.) - Türkçe soru desteği - Türkçe cevap üretimi (çeviri katmanlı) - Hugging Face üzerinde demo arayüzü desteği (Gradio) ## 🚀 Kullanım Starter Colab Notebook : https://colab.research.google.com/drive/1HsWo9g18r1EfKFMh0RcgZgrotoIIcThK?usp=sharing ```python from transformers import AutoModelForCausalLM, AutoTokenizer, CLIPImageProcessor import torch model = AutoModelForCausalLM.from_pretrained("nezahatkorkmaz/turkish-llava-med-pipeline-v1.5-mistral-7b", torch_dtype=torch.float16).to("cuda") tokenizer = AutoTokenizer.from_pretrained("nezahatkorkmaz/turkish-llava-med-pipeline-v1.5-mistral-7b") image_processor = CLIPImageProcessor.from_pretrained("nezahatkorkmaz/turkish-llava-med-pipeline-v1.5-mistral-7b") ``` ## 📋 Örnek Soru > Görsel: Akciğer röntgeni > Soru: **"Bu görüntüde kalp büyümesi var mı?"** > Yanıt: **"Evet, bu görüntüde kardiyomegali (kalp büyümesi) bulguları vardır."** --- ![image/png](https://cdn-uploads.huggingface.co/production/uploads/66d27a34d51528a038d1d50c/3CMHr-_YUArIHsUBBmQfY.png) **Geliştirici:** [@nezahatkorkmaz](https://huggingface.co/nezahatkorkmaz) **Model Orijinali:** `microsoft/llava-med-v1.5-mistral-7b`