“OpenAI’ın Yeni O3 ve O3-Mini Modelleri Neler Sunuyor?”

REKLAM ALANI

23 Aralık 2024 17:00 | Son Güncellenme: 24 Aralık 2024 12:19

OpenAI’ın 12 günlük duyuru serisi o3 model serisinin tanıtımı ile taçlandı. Şu an için genel kullanıma sunulmayan o3 ilk etapta güvenlik testlerine odaklanan araştırmacıların ilgisine sunulacak. o3 ile birlikte o3 mini modeli de tanıtıldı. Sam Altman’ın belirttiğine göre; o3 mini, Ocak ayı sonunda, o3 ise bundan kısa bir süre sonra piyasaya sürülecek.

o3 modelinin detayları

o3, pekiştirmeli öğrenme yoluyla eğitildi. Bu sayede model, özel düşünce zinciri adlı yöntemle yanıt vermeden önce düşünüyor. Model, bir görev üzerinde mantık yürütebilir ve ileriye dönük plan yapabilir. Bununla beraber, modelin uzun bir süre boyunca bir çözüm bulmasına yardımcı olacak bir dizi eylem gerçekleştirebileceğini belirtelim.

ARA REKLAM ALANI

o3’e bir istem verdiğinizde, model, yanıt vermeden önce duraklayarak bir dizi ilgili komut istemini değerlendiriyor. Bu süreçte muhakemesini açıklayan model, düşüncesine göre en doğru yanıtı kullanıcılara sunuyor.

Öne çıkan kıyaslama ölçütleri

o3’ün o1’a kıyasla daha iyi bir performans gösterdiğini söyleyebiliriz. Hatta model, düşük hesaplama ayarında, o1’in performansını üçe katlıyor. American Invitational Mathematics Examination’da o3 yüzde 96,7’lik bir doğruluk puanı elde ederken, o1 yüzde 83,3’lük bir dereceye ulaştı.

Fizik ve kimya sorularından oluşan GPQA Diamond’da yüzde 87,7’ye ulaşan model, EpochAI’ın Frontier Math kriterinde yeni bir rekor kırarak problemlerin yüzde 25,2’sini çözdü. Bu noktada başka hiçbir modelin yüzde 2’yi geçemediğini belirtmekte fayda var.

Model, programlama görevlerine odaklanan bir kıyaslama olan SWE-Bench Verified’da o1’den yüzde 22,8 puan daha iyi performans gösterdi. o3, kodlama becerilerini değerlendiren başka bir ölçüt olan Codeforces derecelendirmesinde ise 2727’ye ulaşıyor.

OpenAI’ın araştırmadan sorumlu kıdemli başkan yardımcısı Mark Chen‘in belirttiğine göre; o3’ün genellikle sadece bir soruyu kaçırmakta. Paylaşılan bilgilere göre; o3, OpenAI’nin modellerini tabi tuttuğu olağan kıyaslama testlerinde o kadar başarılı oldu ki, şirket onu kıyaslamak için daha zorlu testler bulmak zorunda kaldı. ARC PRIZE’ın ürettiği ARC-AGI de bunlardan biri. Bu ölçüt, bir yapay zeka algoritmasının yerinde sezme ve öğrenme yeteneğini test ediyor.

ARC-AGI’yi başarıyla geçebilen bir yapay zeka sisteminin yapay genel zekaya (AGI) doğru önemli bir kilometre taşını temsil edeceği belirtiliyor. 2019’daki ilk çıkışından bu yana hiçbir yapay zeka modelinin ARC-AGI’yi geçemediğini belirtelim. Test, çoğu insanın sezgisel olarak çözebileceği girdi-çıktı sorularından oluşuyor. o3 testten düşük işlemci ayarında yüzde 75,7 puan, ek işlem gücü ile yüzde 87,5’lik bir dereceye ulaştı.

ARC Prize Foundation Başkanı Greg Kamradt, insan performansının yüzde 85 eşiğinde karşılaştırılabileceğini ifade ediyor. Kamradt, bu nedenle bunun üzerine çıkmanın önemli bir kilometre taşı olduğunu belirtiyor. Öte yandan ARC-AGI’nin ortak yaratıcısı François Chollet’in açıkladığına göre; o3, ARC-AGI’deki çok kolay görevlerde başarısız oldu. Bu anlamda model, insan zekasından temel farklılıklar sergiliyor.

03-mini

OpenAI’ın o3-mini, Düşük, Orta ve Yüksek olmak üzere üç farklı akıl yürütme modu sunmak için Adaptive Thinking Time API’sini kullanıyor. Böylece kullanıcılar, modelin bir sorun hakkında ne kadar süre düşüneceğini ayarlayabiliyor. o3-mini, uygun maliyetle OpenAI’ın mevcut o1 akıl yürütme modeliyle karşılaştırılabilir sonuçlar elde edebiliyor.

[embedded content]

OpenAI web sitesi üzerinden modellere erken erişim için başvurmak mümkün. Başvuru süreci 10 Ocak 2025 tarihinde sona erecek. Başvuru formunda geliştiricilerden araştırma odağı, geçmiş deneyimleri, daha önce yayınlanmış makaleleri ve Github’daki kod depolarına bağlantıları dahil olmak üzere pek çok bilgi isteniyor. Geliştiriciler, o3 veya o3-mini olmak üzere test etmek istedikleri modellerden hangisini, ne için kullanmayı planladıklarını seçmek durumunda.

İlgili

EN SON TV sitesinden daha fazla şey keşfedin

Subscribe to get the latest posts sent to your email.

REKLAM ALANI

ETİKETLER: yapay zeka

admin

YORUMLAR

Lütfen görüşlerinizi bize yazınCevabı iptal et

Henüz yorum yapılmamış. İlk yorumu yukarıdaki form aracılığıyla siz yapabilirsiniz.

GÜNCEL KONULAR

Eskişehir’de, Eski Karısını Bıçaklayan Saldırgan Yakalandı”

Gündem, Manşet

25 Aralık 2024 00:23

Eskişehir’de, Eski Karısını Bıçaklayan Saldırgan Yakalandı”

Aksaray’da eski karısını sokak ortasında 14 yerinden bıçaklayarak ağır yaralayan zanlı, cinayet büro ekiplerinin operasyonuyla yakalandı. EN SON TV sitesinden daha fazla şey keşfedin Subscribe to get the latest posts...

Meteoroloji’den Yeni Hava Durumu Haritası: 17 İle Uyarı

Gündem, Manşet

25 Aralık 2024 00:21

Meteoroloji’den Yeni Hava Durumu Haritası: 17 İle Uyarı

Meteoroloji Genel Müdürlüğü (MGM), yeni hava durumu raporunu yayımladı. Rapora göre, 3 il için turuncu, 14 il için sarı alarm verildi. İstanbul, Ankara ve İzmir gibi büyük şehirlerde beklenen hava...

SON DAKİKA’! 2025 Asgari, Ücreti Açıklandı!

Ekonomi, Gündem, Manşet

25 Aralık 2024 00:12

SON DAKİKA’! 2025 Asgari, Ücreti Açıklandı!

Son dakika haberine göre Çalışma ve Sosyal Güvenlik Bakanı Işıkhan, 1 Ocak 2025 tarihinden geçerli olacak asgari ücretin yüzde 30 zam yapılarak net 22 bin 104 lira olarak belirlendiğini duyurdu....

12 GB, RAM’li Poco X7 Pro Özellikleri Sızdı”

Gündem, Teknoloji

24 Aralık 2024 23:59

12 GB, RAM’li Poco X7 Pro Özellikleri Sızdı”

Poco X7 ve X7 Pro modellerinin detayları, bugün önemli bir sızıntıyla karşımıza çıktı. Xiaomi’nin alt markası Poco, iki yeni modeliyle 2024’te piyasaya sürdüğü Poco X6 ve X6 Pro’nun yerini alacak....

Apple, 2025’te MicroLED Ekran Teknolojisiyle Geliyor

Gündem, Manşet, Teknoloji

24 Aralık 2024 23:21

Apple, 2025’te MicroLED Ekran Teknolojisiyle Geliyor

Apple, LCD’den OLED’e geçişini tamamlamaya yaklaşırken daha da ileri bir teknoloji olan microLED’e yönelmeyi planladığı ortaya çıktı. Foxconn, 2025 yılının sonlarına doğru microLED ekranlarının seri üretimine başlayacağını duyurdu. Foxconn, bu...

OpenAI, Kendi İnsansı Robotunu İnşa Etmek İçin İlk Adımları Atıyor

Gündem, Manşet, Teknoloji

24 Aralık 2024 23:21

OpenAI, Kendi İnsansı Robotunu İnşa Etmek İçin İlk Adımları Atıyor

OpenAI’ın, kendi insansı robotunu inşa etmeyi düşündüğü ortaya çıktı. OpenAI ise bu alanda finansal destek sağlayarak uzun süredir faaliyet gösteriyor. Şu ana kadar Figure ve 1X gibi firmalara ve ayrıca...

Xiaomi 15 Ultra’nın Çıkış Tarihi Belli Oluyor: 2025’in En Etkileyici Telefonu

Gündem, Manşet, Teknoloji

24 Aralık 2024 23:16

Xiaomi 15 Ultra’nın Çıkış Tarihi Belli Oluyor: 2025’in En Etkileyici Telefonu

Xiaomi’nin merakla beklenen yeni amiral gemisi Xiaomi 15 Ultra’nın çıkış tarihiyle ilgili yeni detaylar ortaya çıktı. Daha önce bir Xiaomi yöneticisi yeni telefonun Şubat ayında Çin’de piyasaya sürülebileceğini belirtmişti. Bugün...

Google Drive, Videoları Anında İzleme Özelliğini Duyurdu

Gündem, Manşet, Teknoloji

24 Aralık 2024 23:02

Google Drive, Videoları Anında İzleme Özelliğini Duyurdu

Google Drive, artık yüklediğiniz videoları anında oynatma imkanı sunuyor. Yeni özellik ile videoların yükleme işlemi tamamlanır tamamlanmaz izlenebilmesini sağlayacak. Bekleme süresini ortadan kaldıran yeni özellik kullanıma sunuldu. Google, son blog...

GÜNCEL KONULAR

1 Eskişehir’de, Eski Karısını Bıçaklayan Saldırgan Yakalandı”

2 Meteoroloji’den Yeni Hava Durumu Haritası: 17 İle Uyarı

3 SON DAKİKA’! 2025 Asgari, Ücreti Açıklandı!

4 12 GB, RAM’li Poco X7 Pro Özellikleri Sızdı”

5 Apple, 2025’te MicroLED Ekran Teknolojisiyle Geliyor

6 OpenAI, Kendi İnsansı Robotunu İnşa Etmek İçin İlk Adımları Atıyor

7 Xiaomi 15 Ultra’nın Çıkış Tarihi Belli Oluyor: 2025’in En Etkileyici Telefonu

8 Google Drive, Videoları Anında İzleme Özelliğini Duyurdu

9 RTX 50 Serisi Alışveriş Sitelerinde: Fiyatlar Sızdı

10 Çerçevesiz İlk iPhone Modeli Nihayet Geliyor

“OpenAI’ın Yeni O3 ve O3-Mini Modelleri Neler Sunuyor?”

o3 modelinin detayları

Öne çıkan kıyaslama ölçütleri

03-mini

Bunu paylaş:

Bunu beğen:

İlgili

EN SON TV sitesinden daha fazla şey keşfedin

Lütfen görüşlerinizi bize yazınCevabı iptal et

EN SON TV sitesinden daha fazla şey keşfedin