OpenAI, yeni amiral gemisi GPT-4o modelini tanıttı. Model, gerçek bir insan gibi konuşabiliyor, görebiliyor ve duyabiliyor.
Yapay zekâ devrimine öncülük eden ve modelleriyle herkesin ağzını açık bırakan OpenAI, bugün günlerdir beklenen etkinliğini gerçekleştirdi. Şirket, etkinlik sırasında ChatGPT sohbet botu ve GPT-4 dil modeline gelecek yenilikler de dahil önemli duyurular yaptı.
Bugünkü duyurulardan en çok dikkat çekeni, şirketin yeni amiral gemisi dil modeli GPT-4o’ydu. Bu model, mevcut GPT’den daha iyi performans göstermenin yanı sıra çok daha hızlı.
GPT-4o; ses, metin ve görüntü üzerinden mantık yürütebiliyor
Şirketin kullanıcılarına sunacağı yeni GPT-4o modeli, ChatGPT sohbet botuna güç verecek. GPT’nin önceki sürümlerinden çok daha verimli ve önde olarak nitelendirilen model, ses, metin ve görüntü üzerinden mantık yürütebilecek. Açıklamalara göre GPT-4o, yerleşik olarak çok modelli bir yapay zekâ modeli. Bu da ses, metin ve görüntüyü anlayıp içerik üretebileceği anlamına geliyor.
Özellikle sesli yanıt tarafında ciddi gelişme olduğunu söyleyebiliriz. Kullanıcılar artık modelle daha az gecikmeli, çok daha gerçekçi hissettiren gerçek zamanlı konuşmalar gerçekleştirebiliyor. OpenAI’ın aktardığına göre sese 232 milisaniye kadar düşük bir sürede yanıtlar verebiliyor. Bu neredeyse bir insanla konuşmak kadar hızlı. Sesli modda önceden gecikmeler ortalama 2,8 saniyeydi.
Bu gönderiyi Instagram’da gör
Bunun yanı sıra ChatGPT cevap verirken sözünü kesip cevabını değiştirmesini bile isteyebiliyorsunuz. Örneğin etkinlikteki canlı demoda OpenAI yöneticileri modelden bir robot hakkında hikâye anlatmasını istiyor. Model konuşurken de sözünü kesip farklı duygularda yapmasını talep ediyorlar. ChatGPT; anında bu değişimi yaparak karşısındakinin isteğini yerine getirebiliyor. O anlara yukarıdaki videodan göz atabilirsiniz.
Modelin yerleşik olarak gelen gelişmiş görsel yeteneklerinin de demosu yapıldı. Model, cihazın kamerası yoluyla kendisine gösterilen şeyleri “görüp” yorum yapabiliyor. Örneğin bir demoda kâğıda yazılan bir denklem modele gösterildi ve modelden çözümü için yardım istendi. ChatGPT, çözümü bulmaları için onlara yardımcı oldu. Kâğıda “Seni Seviyorum ChatGPT” yazıldığında ise tıpkı bir insan gibi duygusal bir sesle yanıtlar verdi.
Şaşırtıcı derecede iyi bir şekilde gerçek zamanlı çeviri yapabiliyor
https://twitter.com/tomwarren/status/1790074556981403997
Etkinlikteki bir başka demo ise yeni modelin çeviri yetenekleriydi. OpenAI, GPT-4o’nun nasıl gerçek zamanlı çeviri yapabildiğini gözler önüne serdi. Mira Murati İtalyanca konuşurken diğer OpenAI çalışanları İngilizce konuştu. Model, neredeyse hiç gecikme olmadan çok hızlı bir şekilde cümleleri çevirip diğer tarafa aktarabildi.
Öğrencilerin anlık olarak öğrenmesine yardımcı oluyor:
https://twitter.com/bosunatiklama/status/1790111044662084043
Masaüstü uygulaması üzerinden ekranınızı okuyabiliyor, kodlama konusunda yardımcı olabiliyor:
https://twitter.com/itsandrewgao/status/1790069934157910274
GPT-4o’nun bir diğer canlı demosunda kodlama konusundaki bazı yetenekleri gösterildi. ChatGPT’nin yeni masaüstü uygulaması üzerinden gösterilen bu demoda model, yazılan kodu anlayabildi ve analiz edebildi. Ayrıca ne gördüğünü de açıklayabildi.
GPT-4o, kamera yoluyla size bakıp yorumlar yapabiliyor:
https://twitter.com/OpenAI/status/1790072174117613963
OpenAI, etkinlik sona erdikten sonra GPT-4o’nun yeteneklerinden videolar paylaştı. Örneğin birinde modelin ön kamera yoluyla bir insanla gerçekleştirdiği görüşmeyi görebiliyoruz. ChatGPT, kamera yoluyla o kişinin nasıl göründüğünü anlayabiliyor ve görünüşü hakkında yorumlar yapabiliyor. Hatta o kişinin bulunduğu ortam hakkında bile yorum yapıyor. İnsandan ayırt edilmesi zor bir hâl aldığını söylemek yanlış olmaz.
Bir başka demoda kullanıcının yüzüne bakarak mimiklerini ve duygu durumlarını anlayabildiğini görebiliyoruz. Ona “Yüzündeki gülümseme ve küçük bir heyecanla çok mutlu ve neşeli görünüyorsun.” diyor.
İğneleyici şakalar bile yapıyor:
https://twitter.com/tomwarren/status/1790079179892858998
Bir başka örnekte ise modelden iğneleyici şakalar yapması isteniyor. GPT-4o, gerçekten de alaycı bir şekilde konuşup şakalar yapabiliyor.
Sözünü kesip istediğinizi yaptırabilmenize bir örnek:
Bu videoda modelden 10’a kadar sayması isteniyor. Karşısındaki OpenAI çalışanı, saymaya başladıktan sonra sözünü kesiyor ve ondan daha hızlı saymasını istiyor. Tüm istekleri başarılı bir şekilde yerine getirebildiğini, hatta bir kısımda bıkmış gibi bir “Tamam” dediğini bile duyabiliyoruz.
İki GPT-4o sohbet ediyor, birlikte şarkı söylüyor
Görme engellilerin “gözü” olabiliyor
Bir başka örnekte modelin görme yeteneklerinin çok yararlı olabilecek bir kullanım alanına göz atıyoruz. Burada model, görme engelli bir bireye etrafı anlatarak âdeta onun gözü oluyor.
GPT-4o, ücretsiz kullanıcılar tarafından da kullanılabilecek!
OpenAI, dil modeliyle ilgili çok sevindirici bir haber de verdi. Şirketin aktardığına göre GPT-4o, ChatGPT’nin ücretsiz sürümü üzerinden herhangi bir para ödemeden kullanılabilecek. Ancak bir mesaj limit olacak. Bu limit aşıldığında otomatik olarak GPT-3.5’a geri dönülecek. Şirket, GPT-4o’nun metin ve görüntü yeteneklerinin bugün itibarıyla kullanıma sunulmaya başladığını belirtti. Yeni ses modunun ise ilerleyen zamanlarda Plus kullanıcıalrına geleceği aktarıldı.