VNGRS, Türkçe için sıfırdan geliştirilen Kumru LLM’i tanıttı. 7.4 milyar parametreye sahip model, belge işleme, özetleme ve kurumsal soru-cevap sistemleri için tasarlandı. Her ne kadar Türkçe odaklı olsa da İngilizce ve kodlama desteği de sunuyor.
Modelin ön eğitim süreci 45 gün sürdü ve H100/H200 GPU’lar üzerinde 500 GB temizlenmiş veri ile tamamlandı. Açık kaynak Mistral-v0.3 tabanlı Kumru, 8.192 tokenlik bağlam uzunluğu sayesinde yaklaşık 20 A4 sayfasını tek seferde işleyebiliyor. RTX 3090 veya RTX A4000 gibi 16 GB VRAM’e sahip tüketici GPU’larında sorunsuz çalışıyor ve kurum içi konuşlandırma maliyeti yalnızca 2.000 dolar.
Daha küçük versiyonu Kumru-2B ise 2 milyar parametreyle 4.8 GB bellekle çalışabiliyor ve mobil cihazlarda kullanılabiliyor. Yapılan testler, Kumru’nun Türkçe görevlerde LLaMA-3.3–70B, Gemma-3–27B ve Aya-32B gibi daha büyük modelleri geride bıraktığını gösteriyor. Özel Türkçe tokenizasyon sistemi sayesinde uzun metinleri daha hızlı ve düşük maliyetle işleyebiliyor.
