Teknoloji
Moderator
Avrupa merkezli yapay zeka şirketi Mistral, ilk kod merkezli büyük dil modeli (LLM) Codestral'i duyurdu. Codestral, kod üretiminden kod tamamlanmaya kadar kod yazımı görevlerine odaklanıyor. 22 milyar parametreye sahip Codestral, ağırlıklı olarak açık bir üretken yapay zeka modeli olarak karşımıza çıkıyor.
Mistral, Codestral'i ticari olmayan bir lisans altında bugün kullanıma sundu. Mistral'in paylaştığı bilgilere göre, model 80'den fazla programlama dilinde uzmanlaştı. Bu diller arasında SQL, Python, Java, C ve C++ gibi popüler dillerin yanı sıra Swift ve Fortran gibi daha spesifik diller bulunmakta.
Codestral 22B, 32 bin token'lık bağlam penceresine sahip. Model geliştiricilerin hem çeşitli kodlama ortamlarında hem de projelerinde kod yazmasını ve kodla etkileşim kurmasını sağlıyor. Modelin yerine getirebildiği görevler arasında sıfırdan kod oluşturma, kod yazma işlevlerini tamamlama, test yazma ve ortadaki doldurma mekanizmasını kullanarak herhangi bir kısmi kodu tamamlama yer alıyor. Geliştiriciler, projelerini seviyenelendirmek, hata ve bug riskini azaltmak için Codestral'den yararlanabilir.
Bununla beraber paylaşılan bilgilere göre, Codestral, Meta'ya ait CodeLlama 70B ve DeepSeek AI'ın Deepseek Coder 33B'si gibi kod yazma görevleri için tasarlanan önceki modellerden daha iyi performans gösteriyor. Modelin RepoBench'te yüzde 34 doğruluk puanıyla CodeLlama 70B, Deepseek Coder 33B, and Llama 3 70B'dendaha iyi performans gösterdiği görülüyor. Aynı şekilde, Python kod üretimini değerlendirmek için HumanEval ve Python çıktı tahminini test etmek için CruxEval'de, model sırasıyla yüzde 81,1 ve yüzde 51,3 puanlarla rakiplerini geride bıraktı. Üstelik Codestral 22B, Bash, Java ve PHP için HumanEval'deki modellerden daha iyi performans gösterdi.
Geliştiriciler Hugging Face üzerinde Codestral 22B'yi deneyebilir. Ayrıca codestral.mistral.ai ve api.mistral.ai üzerinden de modele ulaşılabilir. Bunlara ek olarak Mistral'in ücretsiz konuşma arayüzü olan Le Chat'te modelin özel olarak çeşitli talimatlarla eğitilmiş bir versiyonuyla sohbet edebileceğini de belirtelim. Modeli kullanan endüstri ortaklarına baktığımızda ise SourceGraph, LlamaIndex, LangChain, Continue.dev, Tabnine ve JetBrains gibi isimleri görmekteyiz.
Mistral, Codestral'i ticari olmayan bir lisans altında bugün kullanıma sundu. Mistral'in paylaştığı bilgilere göre, model 80'den fazla programlama dilinde uzmanlaştı. Bu diller arasında SQL, Python, Java, C ve C++ gibi popüler dillerin yanı sıra Swift ve Fortran gibi daha spesifik diller bulunmakta.
Codestral 22B, 32 bin token'lık bağlam penceresine sahip. Model geliştiricilerin hem çeşitli kodlama ortamlarında hem de projelerinde kod yazmasını ve kodla etkileşim kurmasını sağlıyor. Modelin yerine getirebildiği görevler arasında sıfırdan kod oluşturma, kod yazma işlevlerini tamamlama, test yazma ve ortadaki doldurma mekanizmasını kullanarak herhangi bir kısmi kodu tamamlama yer alıyor. Geliştiriciler, projelerini seviyenelendirmek, hata ve bug riskini azaltmak için Codestral'den yararlanabilir.
Bununla beraber paylaşılan bilgilere göre, Codestral, Meta'ya ait CodeLlama 70B ve DeepSeek AI'ın Deepseek Coder 33B'si gibi kod yazma görevleri için tasarlanan önceki modellerden daha iyi performans gösteriyor. Modelin RepoBench'te yüzde 34 doğruluk puanıyla CodeLlama 70B, Deepseek Coder 33B, and Llama 3 70B'dendaha iyi performans gösterdiği görülüyor. Aynı şekilde, Python kod üretimini değerlendirmek için HumanEval ve Python çıktı tahminini test etmek için CruxEval'de, model sırasıyla yüzde 81,1 ve yüzde 51,3 puanlarla rakiplerini geride bıraktı. Üstelik Codestral 22B, Bash, Java ve PHP için HumanEval'deki modellerden daha iyi performans gösterdi.
Geliştiriciler Hugging Face üzerinde Codestral 22B'yi deneyebilir. Ayrıca codestral.mistral.ai ve api.mistral.ai üzerinden de modele ulaşılabilir. Bunlara ek olarak Mistral'in ücretsiz konuşma arayüzü olan Le Chat'te modelin özel olarak çeşitli talimatlarla eğitilmiş bir versiyonuyla sohbet edebileceğini de belirtelim. Modeli kullanan endüstri ortaklarına baktığımızda ise SourceGraph, LlamaIndex, LangChain, Continue.dev, Tabnine ve JetBrains gibi isimleri görmekteyiz.