Meta’dan sonra Google’da yapay zekaya ses ürettiriyor
Yapay zeka teknolojisi o kadar hızlı bir şekilde ilerliyor ki, bazen insan bu durumdan rahatsızlık duyabiliyor. İşte Google’ın yapay zeka teknolojisi sayesinde yapmak istediklerinden bazıları.
Yapay zeka teknolojisi her geçen gün yeni bir seviyeye ulaşıyor. Birçok kişi bu teknolojiyi ödevlerini tamamlamakta kullanırken, yapay zeka bu tür kullanımların çok daha ötesine geçebiliyor. Google, yıllardır yapay zekanın bu potansiyelini tam anlamıyla keşfetmek için çalışmalar yapıyor. AudioPaLM adını verdikleri son geliştirmeleriyle, eşsiz bir doğrulukla dinleme, konuşma ve çeviri yeteneği sunabilecek bir model üzerinde çalışıyorlar.
Google araştırmacıları, AudioPaLM adını verdikleri, dinleme, konuşma ve çeviri yeteneği olan yeni bir dil modelini tanıttılar. Bu model, PaLM-2 ve AudioLM adındaki iki var olan modelin yeteneklerini birleştirerek oluşturuldu. AudioPaLM, metin tabanlı bir dil modeli olan PaLM-2'nin dilsel bilgi analiz yeteneği ile paralinguistik bilgi koruma konusunda mükemmel olan AudioLM modelinin yeteneklerini bir arada sunarak hem metin üzerinde hem de konuşmada daha geniş kapsamlı bir anlayış ve üretim sağlıyor.
Meta’dan sonra Google’da yapay zekaya ses ürettiriyor
AudioPaLM, konuşmayı ve metni temsil etmek için sınırlı sayıda belirteç kullanan bir kelime dağarcığı kullanıyor. Bu da, konuşma tanıma, metinden sese dönüştürme ve konuşmadan konuşmaya çeviri gibi işlemlerin tek bir mimari ve eğitim sürecine entegre edilmesini mümkün kılıyor.
AudioPaLM, mevcut sistemlere kıyasla daha iyi bir performans gösterdiği belirtildi. Bu model, daha önce karşılaşmadığı dil kombinasyonları için sıfır öğrenme ile metinden konuşmaya çeviri yapabiliyor. Kısa konuşma ipuçlarına dayanarak, sesleri farklı diller arasında taşıyabiliyor ve farklı dillerdeki farklı ses tonlarını yakalayıp yeniden üretebiliyor.