Kategoriler
Kodlama

MusicLM metinlerden müzik oluşturabiliyor

Google’ın geliştirmeye başladığı yapay zeka uygulaması MusicLM, metinler ve görselleri analiz ederek istenen türde bir müzik üretebiliyor.

MusicLM şaşırtıcı derecede yetenekli.

ChatGPT’yi boşverin — müzik, AI içerik üretimi için bir sonraki önemli aşama olabilir. Google kısa bir süre önce, metin açıklamasıyla herhangi bir türde müzik oluşturan bir sistem olan MusicLM isimli bir araştırma yayınladı (https://google-research.github.io/seanet/musiclm/examples/). TechCrunch’ın belirttiği gibi bu, ilk AI müzik üreteci değil, Google’ın AudioML’si ve OpenAI’nin Jukebox’ı gibi projeler de var. Ancak MusicLM’nin modeli ve geniş eğitim veri tabanı (280.000 saatlik müzik), şaşırtıcı çeşitlilikte ve derinlikte müziklerin üretmesini sağlıyor. Çıktıyı beğenebilirsin.

Yapay zeka yalnızca türleri ve enstrümanları birleştirmekle kalmıyor, aynı zamanda bilgisayarların kavraması normalde zor olan soyut kavramları kullanarak parçalar da yazabilmekte. Bir “merak ve huşu duygusu” uyandıran “uzaylı, uhrevî” bir ezgiye sahip bir dans müziği ve reggae karışımı istiyorsanız, MusicLM bunu sizin için yapabilir. Teknoloji, uğultu, ıslık veya bir tablonun tanımına dayalı melodiler bile üretebilir. Bir hikaye modu, bir DJ seti veya film müziği oluşturmak için birkaç açıklamayı bir araya getirebilir.

MusicLM’nin, birçok AI oluşturucuda olduğu gibi elbette sorunları var. Bazı besteler garip geliyor ve vokaller anlaşılmaz olma eğiliminde. Ve performansların kendileri beklediğinizden daha iyi olsa da, insan işlerinin yapamayacağı şekilde tekrarlayıcı olabilirler. Tipik bir şarkının EDM tarzı bir düşüşü veya mısra-nakarat-dize modelini de beklemeyin.

Öte yandan bu yapay zeka müzik üretme aracı ürettiği müzik parçaları şu an 100% telifsiz olarak görülebilir, belki ileride bu konuda da davalar olacaktır. Zaten Google’da bu teknolojiyi telif hakları sebebi ile hemen yayınlamaktan çekiniyor, muhtemelen ileriki yıllarda yapay zeka alanında hukuk gelişirse serbestçe kullanılabilecektir. Telif hakları meselesi sanat içeriği üreten yapay zeka araçlarının önündeki en önemli sorunlardan biri. https://www.theverge.com/2023/1/28/23575919/microsoft-openai-github-dismiss-copilot-ai-copyright-lawsuit

ChatGPT, Google için kırmızı alarm mı?

Talking Tech and AI with Google CEO Sundar Pichai! – Talking tech and AI on the heels of Google I/O. Also a daily driver phone reveal from Google’s CEO. Shoutout to Sundar!

Google bu aralar yapay zekâ özelinde sık sık OpenAI imzalı ChatGPT ile gündeme geliyor. ChatGPT öncesinde metinleri / cümleleri fotoğraflar / tasarımlar haline getiren DALL-E ile de ses getiren OpenAI, Google gibi internet devlerini artık iyiden iyiye endişelendiriyor. Google’ın CEO’su Sundar Pichai, şirketteki çeşitli çalışma gruplarına ChatGPT’nin şirketin arama motoru bölümü üzerinde yarattığı tehdidi ele almaları talimatını verdi. Henüz internet üzerinden yani Google’dan veri çekmeyen, çektiği zaman daha da gelişmiş ve güçlü bir alternatif halini alacak olan ChatGPT, birçok kişi tarafından “Google’ı bitirecek sistem” olarak görülüyor ve Google da bunun farkında bulunuyor.

Konu hakkında daha fazla bilgi için linkler:

Google’s MusicLM: Text Generated Music & It’s Absurdly Good – Google’s MusicLM that uses AudioLM may have just changed the whole text to music AI landscape. Without using any diffusion, MusicLM creates extremely high (24 kHz) audio quality with consistent result that had my jaw dropped. Probably the first working and direct text to music that is accurate and fully synthesized. 2023 has started amazingly.

MusicLM yapay zekasından örnek çıktılar:

  • “Bir atari oyununun ana müziği. Akılda kalıcı bir elektro gitar riffi ile hızlı tempolu ve iyimser. Müzik kendini tekrar ediyor ve hatırlaması kolay ama zil sesleri veya davul sesleri gibi beklenmedik sesler içeriyor.”
  • “Orkestra enstrümanlarının kullanıldığı destansı film müziği. Parça gerginlik yaratır, aciliyet duygusu yaratır. A capella korosunun ahenk içinde söylemesi, bir güç ve kuvvet duygusu yaratır.”
  • “Bu bir r&b/hip-hop müzik parçası. Bir erkek vokal rap ve rap benzeri bir şekilde şarkı söyleyen bir kadın vokal var. Vuruş, elektronik davul desteğiyle melodinin akorlarını çalan bir piyanodan oluşur. Parçanın atmosferi eğlenceli ve enerjik. Bu parça bir lise dram filminin/TV şovunun müziklerinde kullanılabilir. Doğum günü partilerinde veya plaj partilerinde de çalınabilir.”

Özellikle eğlenceli bir demo, bir tablonun açıklamasını alıp serbest bırakmaktır:

Ardından “melodik tekno” (altta) ve “swing” için 5 dakikalık uzun bir kuşak var:

MusicLM, çeşitli türler üretme ve hatta “müzisyen deneyimi düzeyini” (örneğin başlangıç, orta profesyonel) çoğaltma yeteneğine sahiptir. İleride, Google şarkı sözleri oluşturmayı, ses kalitesini iyileştirmeyi ve daha yüksek örnekleme oranlarını keşfedebilir.

Google’ın daha fazla çalışma gereğini öne sürerek “bu noktada model yayınlama planı yok”. Daha fazla oluşturulmuş müzik örneği burada bulunabilir. Şirketin metinden resme ve metinden videoya çalışma çalışmalarına da bakılabilir.