Facebook’un ana şirketi Meta Platforms Salı günü, düzinelerce lisanda konuşmayı çeviri edebilen ve yazıya dökebilen bir yapay zeka modeli yayınladı; bu, lisan ayrımları ortasında gerçek vakitli irtibat sağlayan araçlar için potansiyel bir yapı taşı olarak görülüyor.
Şirket bir blog yazısında, SeamlessM4T modelinin yaklaşık 100 lisanda metin ve konuşma ortasındaki çevirilerin yanı sıra 35 lisan için tam konuşmadan konuşmaya çeviriyi destekleyebileceğini ve daha evvel sırf farklı modellerde mevcut olan teknolojiyi birleştirdiğini söyledi.
CEO Mark Zuckerberg, bu çeşit araçların, şirketin geleceğini bağladığı birbirine bağlı sanal dünyalar kümesi olan metaverse’de dünyanın dört bir yanından kullanıcılar ortasındaki etkileşimleri kolaylaştırmasını öngördüğünü söyledi.
ŞİRKETLER ORTASINDAKİ YAPAY ZEKA YARIŞI KIZIŞIYOR
Blog yazısında, Meta’nın modeli ticari olmayan kullanım için kamuya açık hale getirdiği belirtildi.
Dünyanın en büyük toplumsal medya şirketi bu yıl, Microsoft takviyeli OpenAI ve Google tarafından satılan tescilli modellere önemli bir meydan okuma teşkil eden Llama isimli büyük bir lisan modeli de dahil olmak üzere, çoğunlukla fiyatsız yapay zeka modelleri yayınladı.
Reuters’in aktardığı bilgilere nazaran Zuckerberg, açık bir yapay zeka ekosisteminin Meta’nın avantajına olduğunu, zira şirketin toplumsal platformları için tüketiciye yönelik araçların oluşturulmasında kitle kaynak kullanımını aktif bir formda kullanarak, modellere erişim için fiyat talep etmekten daha fazla kar elde edeceğini söylüyor.
OenAI Bilgileri Müsaadesiz Kullanmakla Suçlandı
Bununla birlikte Meta, modellerini oluşturmak için alınan eğitim dataları konusunda dalın geri kalanıyla emsal yasal sorularla karşı karşıya.
Temmuz ayında komedyen Sarah Silverman ve öbür iki müellif hem Meta hem de OpenAI aleyhine telif hakkı ihlali davası açarak şirketleri kitaplarını müsaadesiz eğitim verisi olarak kullanmakla suçladı.
META’NIN YAPAY ZEKASI 4 MİLYON SAATLİK DATADAN YARARLANDI
SeamlessM4T modeli için Meta araştırmacıları bir araştırma makalesinde, hangi havuz olduğunu belirtmeden, 4 milyon saatlik “taranmış web bilgilerinin kamuya açık bir havuzundan kaynaklanan ham ses” ses eğitim datalarını topladıklarını söyledi.
Bir Meta sözcüsü ses datalarının kaynağına ait sorulara cevap vermedi.
Araştırma makalesinde, metin bilgilerinin geçen yıl oluşturulan ve Wikipedia ile bağlantılı web sitelerinden içerik çeken data kümelerinden geldiği belirtildi.