Microsoft, yapay zeka destekli kodlama asistanı GitHub Copilot için özel olarak eğitilmiş yeni nesil dil modeli MAI-Code-1-Flash’ı duyurdu. Şirketin yapay zeka bölümü tarafından geliştirilen model, üretim ortamındaki gerçek geliştirici iş akışları düşünülerek tasarlandı ve mevcut rakiplerine kıyasla hem daha yüksek başarı oranı hem de önemli ölçüde daha az token tüketimi vaat ediyor.
Gerçek Üretim Verileriyle Eğitildi
MAI-Code-1-Flash, yalnızca kıyaslama testlerinde iyi performans göstermek için değil, geliştiricilerin günlük olarak kullandığı ortamlarda en iyi sonucu verecek şekilde tasarlandı. Microsoft, modeli doğrudan GitHub Copilot’un üretim altyapısında kullanılan eğitim verileriyle eğitti. Bu sayede model, aracı tabanlı (agentic) kodlama görevlerinde çevresel araçlar ve sistemlerle nasıl etkileşime geçeceğini öğrenmiş oldu.
Eğitim süreci boyunca Microsoft, temel yazılım mühendisliği görevleri, depo soru-cevap, yeniden düzenleme (refactoring) ve gerçek GitHub Copilot kullanımından elde edilen telemetri verilerine dayalı görevler üzerinde çeşitli kontrol noktalarını değerlendirdi. Bu hizalama sayesinde çevrimdışı iyileştirmeler, doğrudan gerçek dünyadaki geliştirici deneyimine yansıyor.
Token Başına Maksimum Değer
Modelin en dikkat çekici özelliklerinden biri, uyarlanabilir çözüm uzunluğu kontrolü (adaptive solution length control) ile eğitilmiş olması. Bu teknoloji, modelin görevin karmaşıklığına göre yanıt derinliğini ayarlamasını sağlıyor. Basit isteklerde kısa ve öz yanıtlar üreten model, daha karmaşık problemlerde daha fazla akıl yürütme bütçesi harcayarak kapsamlı çözümler sunabiliyor.
Microsoft’un verilerine göre MAI-Code-1-Flash, zorlu problemleri çözerken rakiplerine kıyasla yüzde 60’a kadar daha az token kullanıyor. Bu da daha düşük gecikme süresi, azalan maliyet ve daha akıcı etkileşimli iş akışları anlamına geliyor.
Kıyaslama Sonuçları
Microsoft, MAI-Code-1-Flash’ı Anthropic’in Claude Haiku 4.5 modeliyle karşılaştırdı. Değerlendirme, SWE-Bench Verified, SWE-Bench Pro, SWE-Bench Multilingual ve Terminal Bench 2 olmak üzere dört farklı kıyaslama testinde gerçekleştirildi.
MAI-Code-1-Flash, test edilen tüm kodlama kıyaslamalarında Claude Haiku 4.5’i geride bıraktı. En çarpıcı fark, gerçek dünya görevlerini içeren SWE-Bench Pro testinde görüldü: Microsoft’un modeli yüzde 51,2 başarı oranıyla, Anthropic’in modelinin yüzde 35,2’lik oranına karşı 16 puanlık bir üstünlük sağladı.
Verimlilik ve Performans Dengesi
MAI-Code-1-Flash’ın en önemli başarısı, yüksek doğruluk ve düşük maliyeti aynı anda sunabilmesi. Geleneksel olarak bir model ne kadar akıllıysa o kadar çok kaynak tüketirken, Microsoft’un yeni modeli bu denklemi tersine çeviriyor. SWE-Bench Verified testinde daha yüksek başarı oranına rağmen yüzde 60 daha az token harcaması, yapay zeka destekli kodlama asistanlarında yeni bir dönemin habercisi olarak değerlendiriliyor.
Model, GitHub Copilot kullanıcıları için kademeli olarak kullanıma sunuluyor. Microsoft, önümüzdeki aylarda MAI-Code-1-Flash’ın yeteneklerini daha da genişletmeyi ve farklı programlama dillerinde desteğini artırmayı planlıyor.