Yapay zeka dünyası, sürekli evrilen ve gelişen teknolojilerle dolu bir alan. OpenAI tarafından geliştirilen GPT-4, uzun süredir sektördeki en güçlü model olarak kabul edilse de, son testler bu durumun değiştiğini gösteriyor.

Yapay Zeka Modeli Rekabetinde Son Durum

LMSys Chatbot Arena Leaderboard'ın performans takibine göre, Anthropic tarafından geliştirilen Claude-3 Opus modeli, en yüksek puanı alarak liderliği ele geçirdi. Bu durum, uzun yıllar lider konumda olan GPT-4'ün geride kaldığını işaret ediyor.

Microsoft Copilot Gpt4Turbo

Karşılaştırmalı Test Sonuçları

"Sohbet savaşları" sırasında jüriler tarafından değerlendirilen liderlik tablosunda, Claude-3 Opus son derecelendirme güncellemesinde 1253 Elo puanıyla zirveye yerleşti. Bunu sırasıyla 1251 ve 1248 puanlarla OpenAI'nin GPT-4 önizleme modelleri takip etti.

En İyi Yapay Zeka Modelleri Listesi

  1. Claude 3 Opus – 1253 puan
  2. GPT-4-1106-preview – 1251 puan
  3. GPT-4-0125-preview – 1248 puan
  4. Bard (Gemini Pro) – 1203 puan
  5. Claude 3 Sonnet – 1196 puan

chatgpt-google-gemini

GPT-4, piyasaya sürüldüğünde büyük bir standart belirlemişti. Ancak Anthropic'in geliştirdiği Claude-3 Opus modeli, sohbet savaşlarında gösterdiği başarılı performansla bu standardı aşmayı başardı ve rekor kırdı. Bu gelişmeler, yapay zeka teknolojisinin hızla geliştiğini ve rekabetin sürekli olarak kızıştığını gösteriyor.

Editör: Samet Varol