içinde

ChatGPT Uygulaması Artık Sizinle Konuşabilir ve Hayatınıza Bakabilir

ChatGPT Uygulaması Artık Sizinle Konuşabilir ve Hayatınıza Bakabilir

Geçtiğimiz Kasım ayında dünyada yapılan bir değişiklik, chatbot uygulamasını çok daha konuşkan hale getiriyor.

Bugün duyurulan iOS ve Android için ChatGPT mobil uygulamalarına yapılan yükseltme, kişinin sorgularını chatbot’a söylemesine ve onun kendi sentezlenmiş sesiyle yanıt verdiğini duymasına olanak tanıyor. ChatGPT’nin yeni sürümü ayrıca görsel zeka da ekliyor: ChatGPT’den bir fotoğraf yükleyin veya çekin; uygulama, görüntünün bir açıklamasıyla yanıt verecek ve Google’ın Lens özelliğine benzer şekilde daha fazla bağlam sunacaktır.

ChatGPT’nin yeni yetenekleri, OpenAI’nin yıllardır üzerinde çalışılan yapay zeka modellerini düzenli, yinelemeli güncellemelere sahip ürünler olarak ele aldığını gösteriyor. Şirketin sürpriz başarısı ChatGPT, daha çok Apple’ın Siri’si veya Amazon’un Alexa’sıyla rekabet eden bir tüketici uygulamasına benziyor.

ChatGPT uygulamasını daha cazip hale getirmek, OpenAI’nin güçlü AI motorlarını eğitmeye yardımcı olmak için kullanıcılardan daha zengin bir veri akışı sağlayarak Google, Anthropic, InflectionAI ve Midjourney gibi diğer AI şirketlerine karşı yarışında yardımcı olabilir. Sesli ve görsel verileri ChatGPT’nin arkasındaki makine öğrenimi modellerine beslemek de yardımcı olabilir.

OpenAI’nin chatbot’una güç veren dil modelleri, en yenileri de dahil olmak üzere, web’deki çeşitli kaynaklardan toplanan büyük miktarda metin kullanılarak oluşturulmuştur. Pek çok yapay zeka uzmanı, tıpkı hayvan ve insan zekasının çeşitli duyusal veri türlerini kullanması gibi, daha gelişmiş yapay zeka oluşturmanın da metinlerin yanı sıra işitsel ve görsel bilgilerin de beslenmesi algoritmaları gerektirebileceğine inanıyor.

Google’ın bir sonraki büyük yapay zeka modeli Gemini, “çok modlu” olduğu yönünde yaygın söylentiler var, bu da yalnızca metinden daha fazlasını işleyebileceği, belki de video, resim ve ses girişlerine izin verebileceği anlamına geliyor. “Model performansı açısından bakıldığında, sezgisel olarak çok modlu modellerin, tek bir yöntemle eğitilmiş modellerden daha iyi performans göstermesini beklerdik” diyor Trevor Darrell (UC Berkeley’de profesör ve AI istemi doğal dili görüntü oluşturma ve manipülasyonla birleştirmeye çalışan bir girişimin kurucu ortağı). “Adil dili kullanarak bir model kurarsak, ne kadar güçlü olursa olsun, yalnızca dili öğrenecektir.”

ChatGPT’nin şirket tarafından kendi bünyesinde geliştirilen yeni ses oluşturma teknolojisi, şirketin teknolojisini başkalarına lisanslaması için de yeni fırsatlar sunuyor. Örneğin Spotify, orijinal podcast yayıncısının sesinin yapay zeka tarafından oluşturulan bir taklidiyle podcast’leri ek dillere çeviren bir özelliği pilot olarak kullanmak için artık OpenAI’nin konuşma sentezi algoritmalarını kullanmayı planladığını söylüyor.

ChatGPT uygulamasının yeni sürümünde sağ üstte kulaklık simgesi, sol altta ise genişleyen menüde fotoğraf ve kamera simgeleri bulunuyor. Bu ses ve görsel özellikler, giriş bilgisini metne dönüştürerek, görüntü veya konuşma tanımayı kullanarak çalışır, böylece sohbet robotu bir yanıt oluşturabilir. Uygulama daha sonra kullanıcının hangi modda olduğuna bağlı olarak ses veya metin yoluyla yanıt verir. Bir WIRED yazarı, yeni ChatGPT’ye kendi sesini kullanarak kendisini “duyup duymadığını” sorduğunda uygulama şu yanıtı verdi: “Seni duyamıyorum, ancak kısa mesajlarınızı okuyabilir ve yanıtlayabilirim”. Çünkü sesli sorgunuz aslında metin olarak işleniyor. Juniper, Ember, Sky, Cove veya Breeze olarak adlandırılan beş sesten biriyle yanıt veriliyor.

Kaynak bağlantısı

Editör: semra – 26.09.2023

Rapor Et

Katılımcı

Çeviri Haber tarafından yazıldı

Doğrulanmış ProfilÜyelik Yılı

Ne düşünüyorsun?

Yorumlar

Bir yanıt yazın

    İnsanın Yaşam Dengesi: Solunum Bozukluğu ve Uyku

    Otonom Sinir Sistemi ve Duyguların Fizyolojisi