MusicLM şaşırtıcı derecede yetenekli.
ChatGPT’yi boşverin — müzik, AI içerik üretimi için bir sonraki önemli aşama olabilir. Google kısa bir süre önce, metin açıklamasıyla herhangi bir türde müzik oluşturan bir sistem olan MusicLM isimli bir araştırma yayınladı (https://google-research.github.io/seanet/musiclm/examples/). TechCrunch’ın belirttiği gibi bu, ilk AI müzik üreteci değil, Google’ın AudioML’si ve OpenAI’nin Jukebox’ı gibi projeler de var. Ancak MusicLM’nin modeli ve geniş eğitim veri tabanı (280.000 saatlik müzik), şaşırtıcı çeşitlilikte ve derinlikte müziklerin üretmesini sağlıyor. Çıktıyı beğenebilirsin.
Yapay zeka yalnızca türleri ve enstrümanları birleştirmekle kalmıyor, aynı zamanda bilgisayarların kavraması normalde zor olan soyut kavramları kullanarak parçalar da yazabilmekte. Bir “merak ve huşu duygusu” uyandıran “uzaylı, uhrevî” bir ezgiye sahip bir dans müziği ve reggae karışımı istiyorsanız, MusicLM bunu sizin için yapabilir. Teknoloji, uğultu, ıslık veya bir tablonun tanımına dayalı melodiler bile üretebilir. Bir hikaye modu, bir DJ seti veya film müziği oluşturmak için birkaç açıklamayı bir araya getirebilir.
MusicLM’nin, birçok AI oluşturucuda olduğu gibi elbette sorunları var. Bazı besteler garip geliyor ve vokaller anlaşılmaz olma eğiliminde. Ve performansların kendileri beklediğinizden daha iyi olsa da, insan işlerinin yapamayacağı şekilde tekrarlayıcı olabilirler. Tipik bir şarkının EDM tarzı bir düşüşü veya mısra-nakarat-dize modelini de beklemeyin.
Öte yandan bu yapay zeka müzik üretme aracı ürettiği müzik parçaları şu an 100% telifsiz olarak görülebilir, belki ileride bu konuda da davalar olacaktır. Zaten Google’da bu teknolojiyi telif hakları sebebi ile hemen yayınlamaktan çekiniyor, muhtemelen ileriki yıllarda yapay zeka alanında hukuk gelişirse serbestçe kullanılabilecektir. Telif hakları meselesi sanat içeriği üreten yapay zeka araçlarının önündeki en önemli sorunlardan biri. https://www.theverge.com/2023/1/28/23575919/microsoft-openai-github-dismiss-copilot-ai-copyright-lawsuit
ChatGPT, Google için kırmızı alarm mı?
Google bu aralar yapay zekâ özelinde sık sık OpenAI imzalı ChatGPT ile gündeme geliyor. ChatGPT öncesinde metinleri / cümleleri fotoğraflar / tasarımlar haline getiren DALL-E ile de ses getiren OpenAI, Google gibi internet devlerini artık iyiden iyiye endişelendiriyor. Google’ın CEO’su Sundar Pichai, şirketteki çeşitli çalışma gruplarına ChatGPT’nin şirketin arama motoru bölümü üzerinde yarattığı tehdidi ele almaları talimatını verdi. Henüz internet üzerinden yani Google’dan veri çekmeyen, çektiği zaman daha da gelişmiş ve güçlü bir alternatif halini alacak olan ChatGPT, birçok kişi tarafından “Google’ı bitirecek sistem” olarak görülüyor ve Google da bunun farkında bulunuyor.
Konu hakkında daha fazla bilgi için linkler:
- engadget.com/google-ai-music-generator-210728046.html
- independent.co.uk/tech/google-chatgpt-ai-code-red-b2249722.html
- theverge.com/2023/1/28/23575919/microsoft-openai-github-dismiss-copilot-ai-copyright-lawsuit
- 9to5google.com/2023/01/28/google-musiclm/
MusicLM yapay zekasından örnek çıktılar:
- “Bir atari oyununun ana müziği. Akılda kalıcı bir elektro gitar riffi ile hızlı tempolu ve iyimser. Müzik kendini tekrar ediyor ve hatırlaması kolay ama zil sesleri veya davul sesleri gibi beklenmedik sesler içeriyor.”
- “Orkestra enstrümanlarının kullanıldığı destansı film müziği. Parça gerginlik yaratır, aciliyet duygusu yaratır. A capella korosunun ahenk içinde söylemesi, bir güç ve kuvvet duygusu yaratır.”
- “Bu bir r&b/hip-hop müzik parçası. Bir erkek vokal rap ve rap benzeri bir şekilde şarkı söyleyen bir kadın vokal var. Vuruş, elektronik davul desteğiyle melodinin akorlarını çalan bir piyanodan oluşur. Parçanın atmosferi eğlenceli ve enerjik. Bu parça bir lise dram filminin/TV şovunun müziklerinde kullanılabilir. Doğum günü partilerinde veya plaj partilerinde de çalınabilir.”
Özellikle eğlenceli bir demo, bir tablonun açıklamasını alıp serbest bırakmaktır:
- Napolyon Alpleri Geçerken, Jacques-Louis David: “Kompozisyon, Napolyon ve ordusunun Mayıs 1800’de Büyük St. [Vikipedi]
Ardından “melodik tekno” (altta) ve “swing” için 5 dakikalık uzun bir kuşak var:
MusicLM, çeşitli türler üretme ve hatta “müzisyen deneyimi düzeyini” (örneğin başlangıç, orta profesyonel) çoğaltma yeteneğine sahiptir. İleride, Google şarkı sözleri oluşturmayı, ses kalitesini iyileştirmeyi ve daha yüksek örnekleme oranlarını keşfedebilir.
Google’ın daha fazla çalışma gereğini öne sürerek “bu noktada model yayınlama planı yok”. Daha fazla oluşturulmuş müzik örneği burada bulunabilir. Şirketin metinden resme ve metinden videoya çalışma çalışmalarına da bakılabilir.