DeepSeek R1, yapılan denemelere göre Çin ile alakalı olarak yöneltilen hassas sorulara cevap vermekten kaçınıyor.
DeepSeek Çinli bir girişim olduğundan, bu durum büyük bir sürpriz olmuyor. Yapılan testler, R1 modelinin hassas konular içeren 1.360 sorunun yüzde 85’ini yanıtlamayı reddettiğini gösteriyor. Çin devletiyle sıkıntı yaşamamak adına hassas birçok konuya özel ayarlama yapan şirket, bu aralar gündemden düşmüyor. ChatGPT gibi çalışan “AI Asistan” isimli mobil uygulaması dün App Store’un en popüler ücretsiz uygulaması (Türkiye dahil) olan DeepSeek, bugün gelen bilgilere göre R1 adı verilen LLM’ini Nvidia H800 kullanarak eğitti. R1’in şu anda verdiği cevaplar ise aktarıldığı kadarıyla Huawei Ascend 910C çiplerin kullanıldığı özel sunucu sistemlerinden geliyor. DeepSeek, GPU konusunda bir ABD ambargosu altında olmalarına rağmen burada test edilebilen “R1” modelinin OpenAI’ın “01” modelinden daha iyi sonuç verdiğini belirtiyor. Şirkete göre R1, AIME, MATH-500 ve SWE-bench Verified kıyaslamalarında o1’i geride bırakıyor, birçok testte ise benzer performans ortaya koyuyor. 671 milyar parametreye sahip olan R1’in, 1,5 milyar parametre ile 70 milyar parametre arasında değişen özel versiyonları da bulunuyor. En küçük modelin bir dizüstü bilgisayarda çalıştırılabildiği, R1’in tam kapasiteli versiyonunun ise hem eğitim hem de tam kapasiteli kullanımda OpenAI’dan çok daha “ucuz” olduğu ifade ediliyor.
I feel this should be a much bigger story: DeepSeek has trained on Nvidia H800 but is running inference on the new home Chinese chips made by Huawei, the 910C. pic.twitter.com/6IAgQlQ3ou
— Alexander Doria (@Dorialexander) January 28, 2025
en son tv sitesinden daha fazla şey keşfedin
Subscribe to get the latest posts sent to your email.