Görsel Yapay Zeka KILAVUZU

DreamFusion ve Skor Damıtma Örneklemesi

DreamFusion, hiçbir zaman herhangi bir 3D veri üzerinde eğitim almadan, eleştirmen olarak 2D görüntü yayılma modelini kullanarak metinden 3D nesneler oluşturur.

Genel Bakış

DreamFusion, hiçbir zaman herhangi bir 3D veri üzerinde eğitim almadan, eleştirmen olarak 2D görüntü yayılma modelini kullanarak metinden 3D nesneler oluşturur. Temel icadı olan Puan Damıtma Örneklemesi, tüm metinden 3D'ye dönüştürme alanının temel tarifi haline geldi.

DreamFusion ve Skor Damıtma Örneklemesi, analiz, operasyonlar ve yaratıcılık için görsel medyayı yorumlayan veya oluşturan bilgisayarlı görüntü iş akışlarına aittir.

Derin Dalış

2022'de Google'den DreamFusion şunu sordu: 2D metinden resme modeli, 3D bir sahneye her açıdan doğru görünmeyi öğretebilir mi? Bir NeRF'yi (Nöral Parlaklık Alanı) optimize eder, böylece rastgele kamera bakış açılarından elde edilen görüntüler gürültülendirilip donmuş bir yayılma modeline (Imagen) gösterildiğinde, metin istemi için makul görüntüler olarak puanlanır. En önemlisi, hiçbir 3D eğitim verisini kullanmaz. Bu çığır açıcı gelişme, Skor Damıtma Örneklemesidir (SDS): Difüzyon modelinin pahalı U-Net'i aracılığıyla geri yayılmak yerine, SDS, modelin tahmin edilen gürültüsünü doğrudan oluşturulan pikseller üzerinde bir gradyan sinyali olarak kullanır. Bunu binlerce bakış açısında tekrarlamak, tek bir cümleden geometri ve görünüme bağlı görünümle tamamlanan tutarlı bir 3D varlık oluşturur.

Teknik Bilgi

SDS, difüzyon modelini dondurulmuş bir puanlama fonksiyonu olarak ele alır. NeRF'yi işler, gürültüyü ekler, difüzyon U-Net'ten bu gürültüyü tahmin etmesini ister ve gradyanı (tahmin edilen gürültü eksi eklenen gürültü) işlenmiş görüntüye ve dolayısıyla NeRF ağırlıklarına geri itilerek hesaplar. U-Net Jacobian'ı atlamak onu izlenebilir hale getirir. Keskin sonuçlar için yüksek düzeyde sınıflandırıcı içermeyen kılavuzluk (100 civarında) gerekir; bu da karakteristik aşırı doygun, bazen bulanık 'DreamFusion görünümüne' neden olur.

DreamFusion ve Skor Damıtma Örneklemesinde Uzmanlaşma

DreamFusion, hiçbir zaman herhangi bir 3D veri üzerinde eğitim almadan, eleştirmen olarak 2D görüntü yayılma modelini kullanarak metinden 3D nesneler oluşturur. Temel icadı olan Puan Damıtma Örneklemesi, tüm metinden 3D'ye dönüştürme alanının temel tarifi haline geldi. DreamFusion ve Skor Damıtma Örneklemesi, analiz, operasyonlar ve yaratıcılık için görsel medyayı yorumlayan veya oluşturan bilgisayarlı görüntü iş akışlarına aittir. Derin bir anlayış oluşturmak için DreamFusion ve Score Distillation Sampling'i tek bir özellik olarak değil, bir işletim modeli olarak ele alın: istenen sonuçları tanımlayın, varsayımları netleştirin ve sistemin güvenilir bir şekilde yapabileceklerini hâlâ uzman görüşü gerektiren şeylerden ayırın.

Uygulamada, DreamFusion ve Score Distillation Sampling'i kullanan güçlü ekipler, doğruluğu veri kalitesi, aydınlatma farklılığı ve etiketleme tutarlılığı gibi operasyonel gerçeklerle dengeler. Açık başarı kriterlerini belgeliyorlar, gerçekçi verilere ve iş akışlarına göre test ediyorlar ve tek seferlik kıyaslama kazanımları yerine gözlemlenen başarısızlık modellerine dayalı olarak yineleniyorlar. Burası teorik anlayışın ürün, politika ve operasyonlar genelinde dayanıklı yeteneğe dönüştüğü yerdir.

Visual AI, inceleme, algılama ve etiketleme görevlerini geniş ölçekte otomatikleştirebilir. Aynı zamanda, görsel hakları ve rıza, kaynağın belirsiz olması durumunda yasal riskler haline gelebilir. En dayanıklı yaklaşım, deneme hızını yönetişim disiplini ile birleştirmektir: pilot uygulamaları çalıştırın, kanıtları toplayın, karar günlüklerini yayınlayın ve model davranışı, kullanıcı beklentileri ve düzenleyici gereksinimler geliştikçe koruma önlemlerini sürekli olarak güncelleyin.

Stratejik Etki

Visual AI, inceleme, algılama ve etiketleme görevlerini geniş ölçekte otomatikleştirebilir.

Visual AI, inceleme, algılama ve etiketleme görevlerini geniş ölçekte otomatikleştirebilir. Yüksek kaliteli dağıtımlarda bu, ölçülebilir işletim kurallarına, sahiplik sınırlarına ve yinelenen inceleme ritüellerine dönüştürülür, böylece ekipler belirsizliği ölçeklendirmek yerine güveni ölçeklendirebilir.

Yaratıcı ekipler, daha az manuel revizyonla konseptleri daha hızlı prototipleyebilir.

Yaratıcı ekipler, daha az manuel revizyonla konseptleri daha hızlı prototipleyebilir. Yüksek kaliteli dağıtımlarda bu, ölçülebilir işletim kurallarına, sahiplik sınırlarına ve yinelenen inceleme ritüellerine dönüştürülür, böylece ekipler belirsizliği ölçeklendirmek yerine güveni ölçeklendirebilir.

Operasyonlar, daha önce işlenmesi zor olan görüntü ve video sinyallerini kullanabilir.

Operasyonlar, daha önce işlenmesi zor olan görüntü ve video sinyallerini kullanabilir. Yüksek kaliteli dağıtımlarda bu, ölçülebilir işletim kurallarına, sahiplik sınırlarına ve yinelenen inceleme ritüellerine dönüştürülür, böylece ekipler belirsizliği ölçeklendirmek yerine güveni ölçeklendirebilir.

DreamFusion ve Skor Damıtma Örneklemesinin Geleceği

SDS, zayıf yönlerini gideren zengin bir çalışma dizisi ortaya çıkardı: çözünürlük ve hız için Magic3D, daha keskin, daha çeşitli çıktılar için ProlificDreamer'ın Variational Score Distillation'ı ve 'Janus'un çok yüzlü eserine saldıran yöntemler. Alan, SDS'yi giderek daha fazla çoklu görüntülü yayılma öncelikleri ve Gaussian Splatting gibi hızlı 3D gösterimlerle eşleştiriyor. Metinden 3D'ye dönüştürmenin daha hızlı büyüyeceğini ve geometrik olarak daha sadık kalacağını, elle modellenen varlıklarla aradaki boşluğun kapanacağını bekleyebilirsiniz.

Gerçek Dünya Uygulaması

Yalnızca metinden 'küçük şapka takan bir sincapın DSLR fotoğrafının' 3 boyutlu modelinin oluşturulması

Manuel 3D şekillendirmeye gerek kalmadan taslak oyun ve AR varlıkları oluşturma

Sıfırdan inşa etmek yerine sanatçıların rafine ettiği, ihraç edilebilir ağlar üretmek

SDS'ye karşı daha yeni metinden 3D'ye dönüştürme yöntemlerini değerlendirmek için araştırma temelleri

Uygulama Modelleri

Uygulamada DreamFusion ve Skor Damıtma Örneklemesi

Yalnızca metinden 'küçük şapka takan bir sincabın DSLR fotoğrafının' 3 boyutlu modeli oluşturuluyor.

Yalnızca metinden 'küçük şapka takan bir sincabın DSLR fotoğrafının' 3 boyutlu modelini oluşturma Ekipler genellikle kalite eşiklerini önceden belirlediklerinde, uç durumlar için insani bir yükseltme yolu tuttuklarında ve zaman içinde hem üretkenlik kazanımlarını hem de hata maliyetlerini takip ettiklerinde daha iyi sonuçlar elde ederler.

Uygulamada DreamFusion ve Skor Damıtma Örneklemesi

Manuel 3D şekillendirmeye gerek kalmadan taslak oyun ve AR varlıkları oluşturma.

Manuel 3D şekillendirme olmadan taslak oyun ve AR varlıkları oluşturma Ekipler genellikle kalite eşiklerini önceden belirlediklerinde, uç durumlar için insani bir yükseltme yolu tuttuklarında ve zaman içinde hem üretkenlik kazanımlarını hem de hata maliyetlerini takip ettiklerinde daha iyi sonuçlar elde ederler.

Uygulamada DreamFusion ve Skor Damıtma Örneklemesi

Sıfırdan inşa etmek yerine sanatçıların rafine ettiği, ihraç edilebilir ağlar üretmek.

Sıfırdan oluşturmak yerine sanatçıların hassaslaştırdığı ihraç edilebilir ağlar üretmek Ekipler genellikle kalite eşiklerini önceden belirlediklerinde, uç durumlar için insani bir yükseltme yolu tuttuklarında ve zaman içinde hem üretkenlik kazanımlarını hem de hata maliyetlerini takip ettiklerinde daha iyi sonuçlar elde ederler.

Uygulamada DreamFusion ve Skor Damıtma Örneklemesi

SDS'ye karşı daha yeni metinden 3D'ye dönüştürme yöntemlerini değerlendirmek için temelleri araştırın.

SDS Ekiplerine göre daha yeni metinden 3D'ye dönüştürme yöntemlerini değerlendirmeye yönelik araştırma temelleri, kalite eşiklerini önceden belirlediklerinde, uç durumlar için insani bir yükseltme yolunu tuttuklarında ve zaman içinde hem üretkenlik kazanımlarını hem de hata maliyetlerini takip ettiklerinde genellikle daha iyi sonuçlar elde ederler.

Riskler ve Korkuluklar

!

Kaynağın belirsiz olması durumunda görüntü hakları ve rıza yasal risk haline gelebilir.

!

Model performansı aydınlatma, demografik özellikler ve ortamlara göre değişiklik gösterebilir.

!

Güven eşikleri izlenmediği sürece yanlış pozitifler fark edilmeyebilir.

Uygulama Yol Haritası

1

Kesinlik, geri çağırma ve hata maliyetlerine ilişkin kabul kriterlerini tanımlayın.

Kesinlik, geri çağırma ve hata maliyetlerine ilişkin kabul kriterlerini tanımlayın. Her adımı bir kanıt kapısı olarak değerlendirin: Kriterler karşılanmazsa, kullanıma sunumu duraklatın, boşluğu kapatın ve ancak bundan sonra kullanımı genişletin.

2

Gerçek üretim koşullarıyla eşleşen verilerle test edin.

Gerçek üretim koşullarıyla eşleşen verilerle test edin. Her adımı bir kanıt kapısı olarak değerlendirin: Kriterler karşılanmazsa, kullanıma sunumu duraklatın, boşluğu kapatın ve ancak bundan sonra kullanımı genişletin.

3

Düşük güvenirliğe sahip veya yüksek etkili tahminler için gerçek kişi tarafından yapılan incelemeyi ekleyin.

Düşük güvenirliğe sahip veya yüksek etkili tahminler için gerçek kişi tarafından yapılan incelemeyi ekleyin. Her adımı bir kanıt kapısı olarak değerlendirin: Kriterler karşılanmazsa, kullanıma sunumu duraklatın, boşluğu kapatın ve ancak bundan sonra kullanımı genişletin.

4

Model kaymasını izleyin ve kamera veya veri kümesi değişikliklerinden sonra yeniden doğrulayın.

Model kaymasını izleyin ve kamera veya veri kümesi değişikliklerinden sonra yeniden doğrulayın. Her adımı bir kanıt kapısı olarak değerlendirin: Kriterler karşılanmazsa, kullanıma sunumu duraklatın, boşluğu kapatın ve ancak bundan sonra kullanımı genişletin.

Keşfetmeye Devam Edin