Kategoriler
Genel

Yapay zeka ses klonlama aracı

Meta, yapay zeka ses klonlama aracını duyurdu.

En yakın arkadaşınızın sesini klonlayabileceğiniz yapay zeka aracı geliştirdi. MEta’nın yeni yapay zeka aracı Voicebox.

Meta, altı dilde konuşabilen ve sadece 2 saniyelik ses verisiyle istenilen kişinin sesini kopyalayabilen metinden konuşmaya yapay zeka sistemi Voicebox’ı duyurdu. Meta, Voicebox’ı “konuşma için üretken yapay zekada bir atılım” olarak nitelendiriyor. Üstelik bu araç sayesinde ciddi bir sorun olan arka plan gürültüsünün de üstesinden gelindiği belirtiliyor.

Ses klonlama sistemleri zaten uzunca bir süredir hayatımızda ancak doğru ve gerçekçi bir klonlama için önceden çok fazla ses verisine ihtiyaç duyuluyordu. Haftalar süren düzenlemeler ile başarılı bir klonlama yapılabiliyordu. Ancak yapay zeka ile tüm süreç birkaç saate indi. Artık birisinin sesini klonlamak için sadece birkaç saniyelik ses verisi yeterli oluyor. Meta’nın Voicebox’ı ise ses kliplerinin arka planından araba kornalarını, köpek havlamasını veya benzer arka plan gürültülerini de kaldırabiliyor.

Meta AI is on fire. They just announced Voicebox, a multilingual high-quality text-to-speech AI. The quality is so good that they’re not making the Voicebox model or code publicly available (yet) to avoid misuse. Sounds like it’s about to go compete with ElevenLabs/PlayHT.

Görme engelliler için kullanılacak

Elbette Voicebox’un amacı kötü bir şey yapmak değil. Voicebox, görme engelli kişilerin arkadaşlarından ve ailelerinden gelen yazılı mesajları duymalarına yardımcı olmak için kullanılacak. Meta, Voicebox’ın çok dilli olduğunu, altı dilde akıcı olduğunu ve kullanıcıların herhangi bir yabancı dili kendi sesleriyle konuşabileceklerini belirtiyor. Diller arasında İngilizce, Fransızca, Almanca, İspanyolca, Lehçe veya Portekizce bulunuyor.

Nasıl çalışıyor?

Aslında oldukça basit. Bir kullanıcı Voicebox’a sesinden bir örnek veriyor. Bu örnek iki saniyelik veya daha uzun bir klip olabilir. Yapay zeka buradan yola çıkarak sesi tahmin ediyor ve kullanıcının gerçekçi ses stilini oluşturuyor.

Öte yandan şimdiden Voicebox bazı önemli etik soruları gündeme getirdi çünkü insanlar artık sevdiklerinin, en iyi arkadaşlarının ve hatta düşmanlarının seslerini iki saniye kadar kısa bir sesle taklit edebilecekler. Böyle bir teknolojinin istenmeyen ciddi sonuçları olabilir. En basitinden bankaların sesli yanıt sistemleri kandırılabilir.

Meta böyle bir teknolojinin potansiyel tehlikesinin farkında ve neyse ki Voicebox’ın temel kodunu gizli tutuyor. Şirket araştırma bloğunda “Üretken konuşma modelleri için birçok heyecan verici kullanım alanı var, ancak potansiyel kötüye kullanım riskleri nedeniyle Voicebox modelini veya kodunu şu anda kamuya açık hale getirmiyoruz” diye yazdı.

Kaynak: www.tweaktown.com/news/92055/meta-announces-breakthrough-ai-tool-that-allows-you-to-clone-your-best-friends-voice/index.html