Teknik KILAVUZ

Çoklu Örnek GPU Bölümleme

Çoklu Örnek GPU (MIG), tek bir fiziksel GPU'yu birden fazla yalıtılmış donanım bölümüne bölen bir NVIDIA teknolojisidir.

Genel Bakış

Çoklu Örnek GPU (MIG), tek bir fiziksel GPU'yu birden fazla yalıtılmış donanım bölümüne bölen bir NVIDIA teknolojisidir. Bu önemlidir çünkü pahalı bir hızlandırıcının birçok küçük iş yüküne aynı anda, birbirlerine müdahale etmeden hizmet vermesine olanak tanır.

Çoklu Örnek GPU Bölümleme, model kalitesini, altyapı maliyetini, gecikmeyi ve güvenilirliği geniş ölçekte etkileyen teknik bir yapı taşıdır.

Derin Dalış

NVIDIA A100 (Amper) ile tanıtılan ve H100 ve daha yeni veri merkezi GPU'larıyla devam eden MIG, bir GPU'yu yedi adede kadar bağımsız örneğe ayırır. MIG, yazılım zaman dilimlemesinden farklı olarak gerçek donanım izolasyonu sağlar: her örnek kendi özel akışlı çoklu işlemcilerine (SM'ler), L2 önbellek dilimlerine, bellek denetleyicilerine ve sabit bir yüksek bant genişlikli belleğe sahip olur. 40 GB'lık bir A100, yedi adet 5 GB'lık örneğe veya daha az sayıda daha büyük örneğe bölünebilir. Her bölüm daha küçük, bağımsız bir GPU gibi davranır, bu nedenle bir durumda gürültülü veya çökmekte olan bir iş diğerini aç bırakamaz veya bozamaz. Bu garantili hizmet kalitesi, MIG'i çıkarım hizmeti, çok kiracılı kümeler ve birçok kullanıcının tek kartı paylaştığı geliştirme ortamları için ideal kılar.

Teknik Bilgi

MIG, GPU'nun dahili çapraz çubuğunu fiziksel olarak kapatarak çalışır, böylece her örnek kendi bellek dilimine ve SM'lere sabit bir yola sahip olur. NVIDIA, profilleri 1g.5gb'den (bir hesaplama dilimi, 5GB) 7g.40gb'ye kadar kesirler olarak tanımlar. GPU Örneği belleği ve SM'leri ayırır; içindeki bir Bilgi İşlem Örneği, SM'leri daha da alt bölümlere ayırır. Bölümler donanım tarafından zorlandığı için hatalar, ECC hataları ve bellek bant genişliği tek bir örnekle sınırlı kalır.

Çok Örnekli GPU Bölümlendirmede Uzmanlaşma

Çoklu Örnek GPU (MIG), tek bir fiziksel GPU'yu birden çok yalıtılmış donanım bölümüne bölen bir NVIDIA teknolojisidir. Bu önemlidir çünkü pahalı bir hızlandırıcının birçok küçük iş yüküne aynı anda, birbirlerine müdahale etmeden hizmet vermesine olanak tanır. Çoklu Örnek GPU Bölümleme, model kalitesini, altyapı maliyetini, gecikmeyi ve güvenilirliği geniş ölçekte etkileyen teknik bir yapı taşıdır. Derin bir anlayış oluşturmak için Çoklu Örnek GPU Bölümlendirmeyi tek bir özellik olarak değil, bir işletim modeli olarak ele alın: arzu edilen sonuçları tanımlayın, varsayımları netleştirin ve sistemin güvenilir bir şekilde yapabileceklerini hâlâ uzman görüşü gerektiren şeylerden ayırın.

Uygulamada, Çoklu Örnek GPU Bölümlendirmeyi kullanan güçlü ekipler, mimariyi, verileri ve altyapı seçeneklerini güvenilirlik ve maliyete göre optimize eder. Açık başarı kriterlerini belgeliyorlar, gerçekçi verilere ve iş akışlarına göre test ediyorlar ve tek seferlik kıyaslama kazanımları yerine gözlemlenen başarısızlık modellerine dayalı olarak yineleniyorlar. Burası teorik anlayışın ürün, politika ve operasyonlar genelinde dayanıklı yeteneğe dönüştüğü yerdir.

Mimari kararlar yıllarca performansı ve işletme maliyetini etkiler. Aynı zamanda, bir kıyaslamayı optimize etmek daha geniş sistem zayıflıklarını gizleyebilir. En dayanıklı yaklaşım, deneme hızını yönetişim disiplini ile birleştirmektir: pilot uygulamaları çalıştırın, kanıtları toplayın, karar günlüklerini yayınlayın ve model davranışı, kullanıcı beklentileri ve düzenleyici gereksinimler geliştikçe koruma önlemlerini sürekli olarak güncelleyin.

Stratejik Etki

Mimari kararlar yıllarca performansı ve işletme maliyetini etkiler.

Mimari kararlar yıllarca performansı ve işletme maliyetini etkiler. Yüksek kaliteli dağıtımlarda bu, ölçülebilir işletim kurallarına, sahiplik sınırlarına ve yinelenen inceleme ritüellerine dönüştürülür, böylece ekipler belirsizliği ölçeklendirmek yerine güveni ölçeklendirebilir.

Teknik eğitim, ekiplerin yalnızca en yenisini değil, doğru yığını seçmesine de yardımcı olur.

Teknik eğitim, ekiplerin yalnızca en yenisini değil, doğru yığını seçmesine de yardımcı olur. Yüksek kaliteli dağıtımlarda bu, ölçülebilir işletim kurallarına, sahiplik sınırlarına ve yinelenen inceleme ritüellerine dönüştürülür, böylece ekipler belirsizliği ölçeklendirmek yerine güveni ölçeklendirebilir.

Daha iyi mühendislik seçenekleri, üretimdeki güvenilirlik olaylarını azaltır.

Daha iyi mühendislik seçenekleri, üretimdeki güvenilirlik olaylarını azaltır. Yüksek kaliteli dağıtımlarda bu, ölçülebilir işletim kurallarına, sahiplik sınırlarına ve yinelenen inceleme ritüellerine dönüştürülür, böylece ekipler belirsizliği ölçeklendirmek yerine güveni ölçeklendirebilir.

Çok Örnekli GPU Bölümlemenin Geleceği

GPU'lar 80 GB, 141 GB ve ötesine büyüdükçe bölümleme daha çekici hale gelir çünkü bireysel modeller çıkarım için nadiren tam bir karta ihtiyaç duyar. Daha sıkı Kubernetes ve bulut entegrasyonu, düğümü tüketmeden dinamik yeniden bölümleme ve daha ayrıntılı profiller bekleyebilirsiniz. Rakip satıcılar benzer SR-IOV tarzı GPU sanallaştırmasının peşinde koşuyor ve sunucusuz çıkarım platformları, birçok modeli yoğun bir şekilde paketlemek ve boşta kalan israfı azaltmak için giderek daha fazla bölümlemeye güveniyor.

Gerçek Dünya Uygulaması

Bir bulut sağlayıcı, bir A100'ü yedi örneğe bölerek yedi müşterinin her birinin çıkarım için garantili, yalıtılmış bir GPU dilimine sahip olmasını sağlıyor.

Bir üniversite araştırma grubu, tüm kartları tekeline almak yerine prototip oluşturması için her doktora öğrencisine 10 GB MIG örneği veriyor.

Çıkarım hizmeti, birkaç küçük dil ve görüntü modelini, her biri öngörülebilir gecikme süresine sahip kendi bölümünde olacak şekilde tek bir H100'de paketler.

Bir Kubernetes kümesi, MIG örneklerini zamanlanabilir kaynaklar olarak tanıtır; böylece bölmeler, diğer kaynaklar gibi 'nvidia.com/mig-1g.5gb' adresini talep eder.

Uygulama Modelleri

Uygulamada Çok Örnekli GPU Bölümleme

Bir bulut sağlayıcı, bir A100'ü yedi örneğe bölerek yedi müşterinin her birinin çıkarım için garantili, yalıtılmış bir GPU dilimine sahip olmasını sağlıyor.

Bir bulut sağlayıcı, bir A100'ü yedi örneğe böler, böylece yedi müşterinin her biri çıkarım için garantili, yalıtılmış bir GPU dilimine sahip olur. Ekipler genellikle kalite eşiklerini önceden belirlediklerinde, uç durumlar için insani bir yükseltme yolu tuttuklarında ve zaman içinde hem üretkenlik kazanımlarını hem de hata maliyetlerini takip ettiklerinde daha iyi sonuçlar elde ederler.

Uygulamada Çok Örnekli GPU Bölümleme

Bir üniversite araştırma grubu, tüm kartları tekeline almak yerine prototip oluşturması için her doktora öğrencisine 10 GB MIG örneği veriyor.

Bir üniversite araştırma kümesi, tüm kartları tekeline almak yerine prototip oluşturmak için her doktora öğrencisine 10 GB MIG örneği verir. Ekipler genellikle kalite eşiklerini önceden tanımladıklarında, uç durumlar için insani bir yükseltme yolu tuttuklarında ve zaman içinde hem üretkenlik kazanımlarını hem de hata maliyetlerini takip ettiklerinde daha iyi sonuçlar elde ederler.

Uygulamada Çok Örnekli GPU Bölümleme

Çıkarım hizmeti, birkaç küçük dil ve görüntü modelini, her biri öngörülebilir gecikme süresine sahip kendi bölümünde olacak şekilde tek bir H100'de paketler.

Çıkarım hizmeti, her biri öngörülebilir gecikme süresine sahip kendi bölümünde birkaç küçük dil ve görüntü modelini tek bir H100'de paketler. Ekipler genellikle kalite eşiklerini önceden belirlediklerinde, uç durumlar için insani bir yükseltme yolunu tuttuklarında ve zaman içinde hem üretkenlik kazanımlarını hem de hata maliyetlerini takip ettiklerinde daha iyi sonuçlar elde ederler.

Uygulamada Çok Örnekli GPU Bölümleme

Bir Kubernetes kümesi, MIG örneklerini zamanlanabilir kaynaklar olarak tanıtır; böylece bölmeler, diğer kaynaklar gibi 'nvidia.com/mig-1g.5gb' adresini talep eder.

Bir Kubernetes kümesi, MIG bulut sunucularını programlanabilir kaynaklar olarak tanıtır; bu nedenle bölmeler, diğer kaynaklar gibi 'nvidia.com/mig-1g.5gb' talebinde bulunur. Ekipler genellikle kalite eşiklerini önceden tanımladıklarında, uç durumlar için insani bir yükseltme yolu tuttuklarında ve hem üretkenlik kazanımlarını hem de zaman içindeki hata maliyetlerini izlediklerinde daha iyi sonuçlar elde ederler.

Riskler ve Korkuluklar

!

Bir kıyaslamayı optimize etmek daha geniş sistem zayıflıklarını gizleyebilir.

!

Altyapı ve bakım maliyetleri genellikle hafife alınır.

!

Sistemler karmaşıklaştıkça güvenlik ve gözlemlenebilirlik boşlukları büyüyebilir.

Uygulama Yol Haritası

1

Uygulamadan önce gecikmeyi, kaliteyi ve maliyet hedeflerini tanımlayın.

Uygulamadan önce gecikmeyi, kaliteyi ve maliyet hedeflerini tanımlayın. Her adımı bir kanıt kapısı olarak değerlendirin: Kriterler karşılanmazsa, kullanıma sunumu duraklatın, boşluğu kapatın ve ancak bundan sonra kullanımı genişletin.

2

Gerçekçi yük ve veri koşulları altında kıyaslama yapın.

Gerçekçi yük ve veri koşulları altında kıyaslama yapın. Her adımı bir kanıt kapısı olarak değerlendirin: Kriterler karşılanmazsa, kullanıma sunumu duraklatın, boşluğu kapatın ve ancak bundan sonra kullanımı genişletin.

3

Hatalar, sapmalar ve kullanıcı etkisi için cihaz izleme.

Hatalar, sapmalar ve kullanıcı etkisi için cihaz izleme. Her adımı bir kanıt kapısı olarak değerlendirin: Kriterler karşılanmazsa, kullanıma sunumu duraklatın, boşluğu kapatın ve ancak bundan sonra kullanımı genişletin.

4

Ölçeklendirmeden önce geri alma ve olay müdahale yollarını hazırlayın.

Ölçeklendirmeden önce geri alma ve olay müdahale yollarını hazırlayın. Her adımı bir kanıt kapısı olarak değerlendirin: Kriterler karşılanmazsa, kullanıma sunumu duraklatın, boşluğu kapatın ve ancak bundan sonra kullanımı genişletin.

Keşfetmeye Devam Edin