Google, üretken yapay zeka temelinde çalışan, görselden ve metinden(yazarak) video üretimi gerçekleştirebilen, özellikle reklamcılık alanında oldukça sık kullanılacağını düşündüğüm “Lumiere” isimli yapay zeka sistemini duyurdu.
Lumiere Hakkında Özet
Google, 2023 yılının Aralık ayında yeni bir yapay zeka sistemi olan Lumiere’yi duyurdu. Lumiere, metin girdilerini kullanarak gerçekçi videolar oluşturabilen bir üretken yapay zeka sistemidir.
Lumiere, mevcut yapay zeka video oluşturma sistemlerinden farklı olarak, videoyu tek bir geçişte üretir. Bu, videonun tutarlılığını ve gerçekçiliğini artırır. Lumiere, 1024×1024 piksel çözünürlüğe kadar videolar oluşturabilir ve şu anda 5 saniyelik videolar üretebilir.
Lumiere, çeşitli modlarda çalışabilir. Örneğin, metni videoya dönüştürebilir, statik görüntüleri dinamik hale getirebilir, örnek tabanlı belirli bir stilde video oluşturabilir, yazılı ipuçlarına göre mevcut videoları düzenleyebilir, belirli bir alanı animasyonlu hale getirebilir veya videoyu parça parça düzenleyebilir.
Lumiere, henüz geliştirme aşamasındadır. Ancak, mevcut sonuçları göz önüne alındığında, gelecekte video oluşturma alanında devrim yaratabilecek bir potansiyele sahiptir.
Lumiere’nin olası kullanım alanları şunlardır:
- Eğitim: Lumiere, eğitim amaçlı olarak kullanılabilir. Örneğin, tarihsel olayların veya bilimsel kavramların videolarını oluşturmak için kullanılabilir.
- Reklamcılık: Lumiere, reklamcılık için kullanılabilir. Örneğin, yeni ürünler veya hizmetleri tanıtmak için gerçekçi videolar oluşturmak için kullanılabilir.
- Eğlence: Lumiere, eğlence amaçlı olarak kullanılabilir. Örneğin, filmler, diziler veya video oyunları için gerçekçi videolar oluşturmak için kullanılabilir.
Lumiere, yapay zeka alanındaki önemli bir gelişmedir. Geliştirilmesi tamamlandığında, video oluşturma alanındaki birçok alanda yeni fırsatlar yaratabilir.
Hazırlanan tanıtım videosunu bu sayfada izleyebileceğiniz yeni sistem Google Lumiere, üretken yapay zeka temelinde hazırlanmış ve yazılanlardan beş saniyelik videolar oluşturabiliyor. Birçok benzerinden daha kaliteli videolar oluşturabilen sistem, şu an 1024×1024 piksellik çıktılar veriyor ve sonucu istenilen tarzda özelleştirebiliyor. Bu konuda Google’ın paylaştığı çok sayıda örnek Github sayfasında yer alırken, üzerinde çalışmaların devam edeceği Lumiere’in son kullanıcıya ne zaman ya da nasıl ulaşacağı henüz bilinmiyor. Google, Lumiere temelinde kullandığı “T2V” adı verilen metinden videoya modelini, metin başlıklarıyla birlikte tam 30 milyon video içeren bir veri seti kullanarak eğittiklerini belirtiyor.
VideoPOET
Google bu konuda ilk defa bir adım atmıyor. Firma bundan önce video üretimi odağında tanıttığı “VideoPOET” ile ses getirmişti. VideoPoet, tekrar hatırlamak adına şirketin yeni LLM’i yani büyük dil modeli. Henüz geliştirme aşamasında olan bu sistem, girilen cümlelerden 10 saniyelik videolar oluşturabiliyor ve burada birçok benzer sistemden daha iyi performans ortaya koyuyor. Aşağıdaki videoda görebileceğiniz altyapı elbette henüz mükemmel seviyede değil ancak gelecek için şimdiden büyük bir potansiyel ortaya koyuyor. Sadece yazı değil girilen fotoğrafları / görselleri de verilen komuta bakarak hareketli hale getirebilen VideoPoet, yeni furya o olduğundan spesifik olarak dikey formatta içerikler üretmesi için tasarlanmış. Henüz OpenAI imzalı DALL-E gibi herkesin kullanılabileceği bir seçenek olmayan yapay zeka, Google araştırmacılarının verdiği bilgiye göre ileride metinden sese ve sesten videoya gibi alanlarda da görev yapacak.