DeepSeek’in Yeni AI Modeli, Şimdiye Kadar Görülen En İyi ‘Açık’ Rakiplerden Biri Oluyor

REKLAM ALANI

26 Aralık 2024 22:44 | Son Güncellenme: 27 Aralık 2024 04:26

A Chinese lab has created what appears to be one of the most powerful “open” AI models to date.

The model, DeepSeek V3, was developed by the AI firm DeepSeek and was released on Wednesday under a permissive license that allows developers to download and modify it for most applications, including commercial ones.

ARA REKLAM ALANI

DeepSeek V3 can handle a range of text-based workloads and tasks, like coding, translating, and writing essays and emails from a descriptive prompt.

According to DeepSeek’s internal benchmark testing, DeepSeek V3 outperforms both downloadable, “openly” available models and “closed” AI models that can only be accessed through an API. In a subset of coding competitions hosted on Codeforces, a platform for programming contests, DeepSeek outperforms other models, including Meta’s Llama 3.1 405B, OpenAI’s GPT-4o, and Alibaba’s Qwen 2.5 72B.

DeepSeek V3 also crushes the competition on Aider Polyglot, a test designed to measure, among other things, whether a model can successfully write new code that integrates into existing code.

DeepSeek-V3!

60 tokens/second (3x faster than V2!)
API compatibility intact
Fully open-source models & papers
671B MoE parameters
37B activated parameters
Trained on 14.8T high-quality tokens
Beats Llama 3.1 405b on almost every benchmark https://t.co/OiHu17hBSI pic.twitter.com/jVwJU07dqf
— Chubby♨️ (@kimmonismus) December 26, 2024

DeepSeek claims that DeepSeek V3 was trained on a dataset of 14.8 trillion tokens. In data science, tokens are used to represent bits of raw data — 1 million tokens is equal to about 750,000 words.

It’s not just the training set that’s massive. DeepSeek V3 is enormous in size: 685 billion parameters. (Parameters are the internal variables models use to make predictions or decisions.) That’s around 1.6 times the size of Llama 3.1 405B, which has 405 billion parameters.

DeepSeek (Chinese AI co) making it look easy today with an open weights release of a frontier-grade LLM trained on a joke of a budget (2048 GPUs for 2 months, $6M).
For reference, this level of capability is supposed to require clusters of closer to 16K GPUs, the ones being… https://t.co/EW7q2pQ94B
— Andrej Karpathy (@karpathy) December 26, 2024

Parameter count often (but not always) correlates with skill; models with more parameters tend to outperform models with fewer parameters. But large models also require beefier hardware in order to run. An unoptimized version of DeepSeek V3 would need a bank of high-end GPUs to answer questions at reasonable speeds.

En pratik model olmasa da DeepSeek V3 bazı açılardan bir başarıdır. DeepSeek, modeli Nvidia H800 GPU’larından oluşan bir veri merkezi kullanarak sadece iki ayda eğitebildi; bu GPU’lar Çinli şirketlerin yakın zamanda ABD Ticaret Bakanlığı tarafından tedarik edilmesinin kısıtlandığı GPU’lardı. Şirket ayrıca DeepSeek V3’ü eğitmek için sadece 5,5 milyon dolar harcadığını iddia ediyor; bu, OpenAI’nin GPT-4’ü gibi modellerin geliştirme maliyetinin bir kısmı.

Olumsuz tarafı, modelin siyasi görüşlerinin biraz filtrelenmiş olmasıdır. Örneğin, DeepSeek V3’e Tiananmen Meydanı hakkında soru sorun, cevap vermez.

Çinli bir şirket olan DeepSeek, modellerinin yanıtlarının “temel sosyalist değerleri somutlaştırmasını” sağlamak için Çin’in internet düzenleyicisi tarafından kıyaslamaya tabi tutuluyor . Birçok Çin AI sistemi, Xi Jinping rejimi hakkındaki spekülasyonlar gibi düzenleyicilerin öfkesini çekebilecek konulara yanıt vermeyi reddediyor .

Yakın zamanda OpenAI’nin o1 “akıl yürütme” modeline bir cevap olan DeepSeek-R1’i tanıtan DeepSeek, ilginç bir organizasyondur. AI’yı işlem kararlarını bilgilendirmek için kullanan Çinli bir niceliksel hedge fonu olan High-Flyer Capital Management tarafından desteklenmektedir.

DeepSeek’in modelleri, ByteDance, Baidu ve Alibaba gibi rakiplerini, bazı modellerinin kullanım fiyatlarını düşürmeye, bazılarını da tamamen ücretsiz yapmaya zorladı.

High-Flyer, model eğitimi için kendi sunucu kümelerini oluşturuyor; bunlardan en sonuncusunun 10.000 Nvidia A100 GPU’su olduğu ve 1 milyar yen (~138 milyon $) maliyeti olduğu bildiriliyor . Bilgisayar bilimleri mezunu Liang Wenfeng tarafından kurulan High-Flyer, DeepSeek kuruluşu aracılığıyla “süper zeki” AI elde etmeyi hedefliyor.

Liang, bu yılın başlarında verdiği bir röportajda açık kaynak kodluluğu “kültürel bir eylem” olarak tanımladı ve OpenAI’nin “geçici” bir hendek gibi kapalı kaynaklı AI’yı nitelendirdi. “OpenAI’nin kapalı kaynaklı yaklaşımı bile diğerlerinin yetişmesini engellemedi,” diye belirtti.

Aslında.

İlgili

EN SON TV sitesinden daha fazla şey keşfedin

Subscribe to get the latest posts sent to your email.

REKLAM ALANI

admin

YORUMLAR

Lütfen görüşlerinizi bize yazınCevabı iptal et

Henüz yorum yapılmamış. İlk yorumu yukarıdaki form aracılığıyla siz yapabilirsiniz.

GÜNCEL KONULAR

Huawei MatePad 11.5 Türkiye’de satışa sunuldu

Manşet, Teknoloji

27 Aralık 2024 18:30

Huawei MatePad 11.5 Türkiye’de satışa sunuldu

Huawei, Türkiye pazarında yeni tableti MatePad 11.5’i satışa sundu. 10.999 TL’den başlayan fiyatlarla kullanıcılarla buluşan bu cihaz, göz konforunu ve verimliliği bir araya getiren PaperMatte ekranıyla dikkat çekiyor. Özellikle öğrenciler...

Yeni Yıla Zamlarla Giriyoruz: Gündemde Neler Var?

Teknoloji

27 Aralık 2024 18:00

Yeni Yıla Zamlarla Giriyoruz: Gündemde Neler Var?

2si1’in bu bölümünde asgari ücret ile zamlardan başlayarak son günlerde öğrendiğimiz yeni zamları konuştuk. Ciddi konulardan kaçmak için de her zaman olduğu gibi oyun gündemine geçtik. EN SON TV sitesinden...

Teknoloji

27 Aralık 2024 17:48

Google’ın Yapay Zeka Teknolojisi, Nothing Telefonlarda!

Google’ın 2024’ün başlarında kullanıma sunduğu yapay zeka özelliklerinden biri olan Circle to Search, Pixel ve Samsung cihazların ardından Nothing Phone’a geldi. EN SON TV sitesinden daha fazla şey keşfedin Subscribe...

Fransa, Türkiye’ye Meteor Füzesi Satışı İçin Anlaşmaya Vardı!

Teknoloji

27 Aralık 2024 17:20

Fransa, Türkiye’ye Meteor Füzesi Satışı İçin Anlaşmaya Vardı!

Türkiye bir süredir Avrupa’dan Eurofighter Typhoon almaya çalışırken bu uçaklarda kullanılması son derece önemli olan MBDA yapımı Meteor füzeleri konusunda önemli bir gelişme yaşandı. EN SON TV sitesinden daha fazla...

Başkan Erdoğan: Mülteciler üzerinden her türlü provokasyonu denediler

Dünya, Gündem, Manşet

27 Aralık 2024 15:48

Başkan Erdoğan: Mülteciler üzerinden her türlü provokasyonu denediler

Başkan Recep Tayyip Erdoğan, Partisinin Balıkesir 8. Olağan İl Kongresi’nde önemli açıklamalarda bulundu. Başkan Erdoğan’ın açıklamaları şu şekilde; Sevgili Balıkesirliler, yol ve dava arkadaşlarım sizleri en kalbi duygularımla selamlıyorum. Balıkesirli...

Başkan Erdoğan’a askerlik fotoğrafı sürprizi

Dünya, Gündem, Manşet

27 Aralık 2024 15:35

Başkan Erdoğan’a askerlik fotoğrafı sürprizi

BAŞKAN ERDOĞAN’IN ASKERLİK FOTOĞRAFI ORTAYA ÇIKTIARA REKLAM ALANI Basına kapalı gerçekleşen ziyarette, Valilik şeref defterini imzalayan Başkan Erdoğan, Vali Ustaoğlu’ndan kentteki çalışmalara ilişkin bilgi aldı. Öte yandan, kentteki temasları için...

Halı saha maçında kavga ettiği kişiye ‘Sen kime lan diyorsun? dedi! Yarım saat sonra gözaltına alındı

Gündem, Manşet, Yerel haber

27 Aralık 2024 14:59

Halı saha maçında kavga ettiği kişiye ‘Sen kime lan diyorsun? dedi! Yarım saat sonra gözaltına alındı

Olay, 9 Eylül 2023’te gece yarısı sıralarında Vezirköprü ilçesi Esentepe Mahallesi’ndeki halı sahada meydana geldi. Adliye ve askeri personel ile avukatların halı saha maçında Uzman Çavuş Aykan D. ile Cumhuriyet...

SON DAKİKA KAR YAĞIŞI HABERLERİ: İstanbul’da kar yağacak mı? Kar uyarısı…

Gündem, Manşet, Yerel haber

27 Aralık 2024 14:56

SON DAKİKA KAR YAĞIŞI HABERLERİ: İstanbul’da kar yağacak mı? Kar uyarısı…

İstanbul Büyükşehir Belediyesi Afet İşleri Dairesi Başkanlığı’ndan (AKOM) tarafından İstanbul’un yüksek kesimlerinde karla karışık yağmur ve kısa süreli kar yağışı görülebileceği uyarısında bulundu. AKOM’un açıklamasında, “İstanbul ve Marmara Bölgesi genelinde...

GÜNCEL KONULAR

1 Huawei MatePad 11.5 Türkiye’de satışa sunuldu

2 Yeni Yıla Zamlarla Giriyoruz: Gündemde Neler Var?

3 Google’ın Yapay Zeka Teknolojisi, Nothing Telefonlarda!

4 Fransa, Türkiye’ye Meteor Füzesi Satışı İçin Anlaşmaya Vardı!

5 Başkan Erdoğan: Mülteciler üzerinden her türlü provokasyonu denediler

6 Başkan Erdoğan’a askerlik fotoğrafı sürprizi

7 Halı saha maçında kavga ettiği kişiye ‘Sen kime lan diyorsun? dedi! Yarım saat sonra gözaltına alındı

8 SON DAKİKA KAR YAĞIŞI HABERLERİ: İstanbul’da kar yağacak mı? Kar uyarısı…

9 Bakan Güler’den Azerbaycan’ın Ankara Büyükelçiliğine ziyaret

10 Cumhurbaşkanı Erdoğan’a Balıkesir’de fotoğraf sürprizi!

DeepSeek’in Yeni AI Modeli, Şimdiye Kadar Görülen En İyi ‘Açık’ Rakiplerden Biri Oluyor

Bunu paylaş:

Bunu beğen:

İlgili

EN SON TV sitesinden daha fazla şey keşfedin

Lütfen görüşlerinizi bize yazınCevabı iptal et

EN SON TV sitesinden daha fazla şey keşfedin