Elon Musk'un güncellenmiş Grok AI'sı kodlama ve matematikte daha iyi
Elon Musk'un ChatGPT'ye cevabı matematik, kodlama ve daha fazlasını daha iyi hale getirmek için bir güncelleme yapmak oldu.
Musk'un xAI'si, Grok-1.5'i "gelişmiş yetenekler ve muhakeme" ve daha uzun bağlamları işleme yeteneği ile ilk test uzmanlarına sundu. Şirket artık çeşitli alanlarda GPT-4, Gemini Pro 1.5 ve Claude 3 Opus'a rakip olduğunu iddia ediyor.
xAI'nin rakamlarına bakılırsa Grok-1.5, Grok-1'e göre büyük bir gelişme gibi görünüyor. MATH kıyaslamasında önceki puanın iki katından fazlasına, %50,6’ya çıktı. Ayrıca GSM8K (matematiksel kelime problemleri) ve HumanEval'de (kodlama) sırasıyla %90 ve %74,1’e yükseldi; önceki oranlar %62,9 ve %63,2’ydi. Bu rakamlar Gemini Pro 1.5, GPT-4 ve Claude 3 Opus'a çok yakın; aslında HumanEval kodlama puanı Claude 3 Opus dışındaki tüm rakipleri geride bırakıyor.
Ayrıca bağlam penceresi içerisinde 128 bin tokene kadar uzun bağlamları işleyebiliyor; bu da bir durumu anlamak için daha fazla kaynaktan gelen verileri birleştirebileceği anlamına geliyor. Şirket, "Bu, Grok'un önceki bağlam uzunluğunun 16 katına kadar artırılmış bellek kapasitesine sahip olmasını sağlayarak, önemli ölçüde daha uzun belgelerdeki bilgileri kullanmasına olanak tanıyor" dedi.
Elon Musk'un güncellenmiş Grok AI'sı kodlama ve matematikte daha iyi
xAI, Grok'un hala geride kalmış olabileceği diğer alanlardaki (akademik puanlar, çok modlu ve diğerleri) ilerlemesini ayrıntılandırmadı. Grok-1.5 ise konumunu uzun süre koruyamayabilir. OpenAI'ye göre ChatGPT 5'in bu yaz gelmesi planlanıyor ve "bir makine yerine bir insanla iletişim kurduğunuzu hissettiren" bir özellik seti vaat ediyor.
Şu anda Grok yalnızca X'teki Premium+ katmanındaki kullanıcılar için mevcut ancak Elon Musk kısa süre önce bunu X'in normal Premium kullanıcılarına açacağına söz verdi. Şirket ayrıca, Musk'un kar amacı gütmeyen misyonunu terk ettiği iddiasıyla OpenAI ve Sam Altman'a dava açmasının ardından yakın zamanda Grok sohbet robotunu da açık kaynak haline getirdi.