Sesinizi tamamen kopyalamak için 15 saniye yeterli, çok dikkatli olun
OpenAI kısa süre önce Voice Engine adlı yeni bir aracın küçük ölçekli bir ön izlemesini gerçekleştirdiğini duyurdu.
Bu, 15 saniyelik bir ses örneğini analiz ederek herhangi bir konuşmacıyı taklit edebilen bir ses klonlama teknolojisi. Şirket, "duygusal ve gerçekçi seslerle" "doğal ses veren konuşma" ürettiğini söylüyor.
Teknoloji, şirketin önceden var olan metin okuma API'sini temel alıyor ve 2022'den beri üzerinde çalışılıyor. OpenAI, mevcut metin okuma sürümünde mevcut olan önceden ayarlanmış sesleri desteklemek için araç setinin bir sürümünü zaten kullanıyor. API ve Sesli Okuma özelliği. Şirketin resmi blogunda çok sayıda örnek var ve bunlar gerçeğe ürkütücü derecede yakın görünüyor.
OpenAI, bu teknolojinin okuma yardımı, dil çevirisi ve ani veya dejeneratif konuşma koşullarından muzdarip olanlara yardım etmek için yararlı olduğunu gördüklerini söylüyor. Şirket, bir okul projesi için kaydedilen seslerden alınan bir Voice Engine klonu oluşturarak konuşma bozukluğu sorunları olan bir hastaya yardımcı olan bir Brown Üniversitesi pilot programı başlattı.
Sesinizi tamamen kopyalamak için 15 saniye yeterli, çok dikkatli olun
Potansiyel faydalara rağmen, kötü aktörler kesinlikle bu teknolojiyi bazı ciddi deepfake saçmalıklarına girişmek için suistimal edeceklerdir ki bu zaten bir sorundur. Bunu akılda tutarak, Voice Engine prime time'a tam olarak hazır değil çünkü tam kullanıma sunulmadan önce karşılanması gereken ciddi gizlilik endişeleri var.
OpenAI, bu teknolojinin "özellikle seçim yılında akla ilk gelen ciddi risklere" sahip olduğunu kabul ediyor. Şirket, ürünün minimum miktarda riskle piyasaya sürülmesini sağlamak için "hükümet, medya, eğlence, eğitim, sivil toplum ve ötesindeki ABD'li ve uluslararası ortaklardan" gelen geri bildirimleri birleştirdiğini söylüyor. Önizleme testçilerinin tümü, OpenAI'nin başka bir kişinin rızası veya yasal hakkı olmadan taklit edilmesini yasaklayan kullanım politikalarını kabul etti.