Facebook’un ana şirketi Meta, geçtiğimiz hafta yayınladığı bir blog yazısıyla Voicebox’ı duyurdu. Meta’ya nazaran Voicebox “konuşma üretimi için en çok taraflı yapay zeka”. Yazılım, ses düzenleme, örnekleme, tarz oluşturma ve erişilebilirlik bahislerinde yardımcı olmak gayesiyle geliştirildi.
SESİ TAKLİT ETMESİ İÇİN İKİ SANİYE DİNLEMESİ YETİYOR
Meta tarafından geliştirilen Voicebox, bir kişinin sesini duyar duymaz birebir sesi taklit edebiliyor. Örneğin Voicebox’a sesinizi dinlettiğinizde, uygulama kısa müddette sesinizi tahlil edip taklit edebiliyor ve hangi metin olursa olsun o metni meselesiz olarak sizin taklit edilen sesinizle okuyabiliyor.
Şirket geliştirilen yapay zekanın güvenlik riskleri nedeniyle yayınlanmayacağını duyurdu.
Geliştirilen yapay zeka,; ChatGPT metin için, DALL-E sanat için neyse, Voicebox da ses için o manaya geliyor.
BİR KİŞİNİN SESİNİ ÜRETEBİLMESİ İÇİN DİNLEMESİ YETİYOR
Meta yeni yazılımı tanımlarken “Voicebox yüksek kaliteli ses klipleri üretebilir ve evvelden kaydedilmiş sesleri düzenleyebilir (araba kornalarını ya da köpek havlamasını kaldırmak gibi); tüm bunları yaparken sesin içeriğini ve tarzını korur” diye yazdı. “Model birebir vakitte çok lisanlı ve altı lisanda konuşma üretebiliyor.”
Model, İngilizce, Fransızca, İspanyolca, Almanca, Lehçe ve Portekizce lisanlarında 50.000 saatin üzerinde filtrelenmemiş ses kullanılarak eğitildi.
Meta’ya nazaran Voicebox %1’lik bir kusur oranı düşüşüne sahiptir.
KULLANICILAR GELEN METİN İLETİLERİNİ GÖNDERENİN SESİYLE DUYABİLECEK
Meta, yazıda Voicebox’ın çeşitli vazifeleri yerine getirmeye yardımcı olabileceğini söylüyor, fakat en önemli kullanım durumlarını vurguluyor: bağlamsal metinden konuşmaya sentez, konuşma düzenleme ve gürültü azaltma, lisanlar ortası tarz transferi ve çeşitli konuşma örneklemesi.
Meta’nın yazısında Voicebox’ın “üretken yapay zeka araştırmamızda ileriye hakikat atılmış değerli bir adım” olduğunu belirttiği göz önüne alındığında, Voicebox’ın erişilebilirlikle ilgili çıkarımları karşısında heyecanlanmamak elde değil. Meta, duyurularının başında Voicebox’ın “görme engelli şahısların arkadaşlarından gelen yazılı iletileri kendi sesleriyle duymalarını sağlayabileceğini” yazarak bunu kabul ediyor.
DERİN UYDURMA İÇERİKLERİN ARTMASINDAN KORKULUYOR
Forbes mecmuasının internet sitesinde yayınlanan makaleye nazaran uzmanlar yapay zeka’nin giderek artan değeri ve kapasitesi, şuurlu bilgisayarlar tarafından köleleştirilmeye mahkum olduğumuz manasına gelmediğini belirtiyor.
Digital Trends’ten Fionna Agomuoh’un geçen hafta yayınladığı bir rapora nazaran, Meta’nın şu anda Voicebox’ı ya da kaynak kodunu halka açma üzere bir planı yok. Agomuoh’un da belirttiği üzere, FBI “derin uydurma içerik” konusunda giderek daha fazla telaş duymaya başladı. Kolluk kuvvetleri, Agomuoh’un öyküsünde yazdığı üzere, “gasp, şantaj ve taciz” içeren hatalar konusunda vakit içinde ikazlarda bulundu.
Meta, Voicebox’ın kamuya açılmasını engelleme kararının kısmen, yapay zeka tabanlı teknolojiler geliştirirken “açıklık ile sorumluluk ortasında gerçek dengeyi kurmanın gerekli” olmasından kaynaklandığını söyledi.