Stable Diffusion’ın arkasındaki geliştirici olan Stability AI, metin istemiyle kısa biçimli videolar oluşturabilen yeni bir üretken yapay zekanın ön izlemesini yapıyor.
Uygun bir şekilde çağrıldı Kararlı Video Dağıtımıiki AI modelinden (SVD ve SVD-XT olarak bilinir) oluşur ve 576 x 1.024 piksel çözünürlükte klipler oluşturma kapasitesine sahiptir. Kullanıcılar, kare hızı hızını üç ila 30 FPS arasında çalışacak şekilde özelleştirebilecek. Videoların uzunluğu ikiz modellerden hangisinin seçildiğine bağlıdır. SVD’yi seçerseniz içerik 14 kare oynatılırken SVD-XT bunu biraz 25 kareye çıkarır. Buna göre, oluşturulan klipler sona ermeden önce yalnızca yaklaşık dört saniye oynatılacağından uzunluk çok fazla önemli değil. Hugging Face’in resmi listesi.
Şirket, YouTube kanalında Stable Video Diffusion’ın neler yapabileceğini ve içeriğin şaşırtıcı derecede yüksek kalitede olduğunu gösteren bir video yayınladı. Bunlar kesinlikle diğer yapay zekalarda gördüğünüz kabus yakıtı değiller. Meta’nın Video Hazırlaması. Bize göre en etkileyici olanı Ice Dragon demosu olmalı. Ejderhanın pullarında çok fazla ayrıntı görebilirsiniz, ayrıca arkadaki dağlar da bir tablodan fırlamış gibi görünüyor. Animasyon, tahmin edebileceğiniz gibi, konu yalnızca yavaşça başını sallayabildiğinden oldukça sınırlıdır. Aynısını diğer demolarda da görmek mümkün. Ya sert bir yürüyüş döngüsü ya da yavaş bir kaydırma vuruşu.
Erken evrelerde
Sınırlamalar bununla bitmiyor. Stable Video Diffusion’ın “mükemmel fotorealizmi elde edemediği”, “okunaklı metin” üretemediği ve ayrıca yüzlerle ilgili zor zamanlar geçirdiği bildiriliyor. Stability AI’nin web sitesindeki bir başka gösteri, modelinin bir adamın yüzünü herhangi bir tuhaf kusur olmadan görüntüleyebildiğini, dolayısıyla duruma göre ayrı ayrı yapılabileceğini gösteriyor.
Bu projenin henüz başlangıç aşamasında olduğunu unutmayın. Modelin geniş bir sürüme hazır olmadığı ve buna yönelik herhangi bir planın olmadığı açık. Stability AI, Stabil Video Difüzyonunun şu anda “gerçek dünya veya ticari uygulamalara yönelik” olmadığını vurguluyor. Aslında şu anda “yalnızca araştırma amaçlıdır.” Geliştiricinin teknolojisi konusunda çok dikkatli olmasına şaşırmadık. Geçen yıl şöyle bir olay yaşandı: Stabilite Difüzyonunun modeli internete sızdırıldıkötü aktörlerin bunu derin sahte görüntüler oluşturmak için kullanmasına yol açıyor.
Kullanılabilirlik
Stabil Video Difüzyonunu denemek ilginizi çekiyorsa, aşağıdaki formu doldurarak bir bekleme listesine girebilirsiniz: Şirketin web sitesindeki form. İnsanların ne zaman içeri girmesine izin verileceği bilinmiyor ancak ön izlemede Metinden Videoya arayüzü yer alacak. Bu arada şuraya göz atabilirsin AI’nın teknik incelemesi ve projenin arkasındaki tüm ayrıntıları okuyun.
Belgeyi inceledikten sonra ilginç bulduğumuz şey, eğitim materyalinin bir kısmı olarak “kamuya açık video veri kümelerinin” kullanılmasından bahsetmesiydi. Tekrar ediyorum, bunu göz önünde bulundurarak duymak şaşırtıcı değil Getty Images, Stability AI’ye dava açtı Bu yılın başlarında veri kazıma iddiaları üzerine. Görünüşe göre ekip daha fazla düşman edinmemek için daha dikkatli olmaya çalışıyor.
Stabil Video Difüzyonunun ne zaman başlayacağına dair bir bilgi yok. Neyse ki başka seçenekler de var. TechRadar’ın 2023’ün en iyi yapay zeka video yapımcıları listesine göz atmayı unutmayın.