Teknik KILAVUZ

YaRN ve Bağlam Uzunluğu Uzantısı

YaRN (Yine başka bir RoPE uzantısı), bir modelin kullanılabilir bağlam penceresini üzerinde eğitim verildiğinin çok ötesine genişletmek için etkili bir tekniktir.

Genel Bakış

YaRN (Yine başka bir RoPE uzantısı), bir modelin kullanılabilir bağlam penceresini üzerinde eğitim verildiğinin çok ötesine genişletmek için etkili bir tekniktir. Döner konum yerleştirmelerini akıllıca yeniden ölçeklendirir, böylece örneğin 4K jetonlar üzerinde eğitilmiş bir model, minimum ince ayar ile 32K veya daha fazlasını işleyebilir.

YaRN ve Bağlam Uzunluğu Uzantısı, model kalitesini, altyapı maliyetini, gecikmeyi ve güvenilirliği geniş ölçekte etkileyen teknik bir yapı taşıdır.

Derin Dalış

Çoğu modern LLM, sorgu ve anahtar vektörleri konuma bağlı açılara göre döndüren RoPE (Döner Konum Yerleştirmeleri) ile jeton konumlarını kodlar. Eğitim uzunluğundan daha uzun dizileri beslediğinizde, bu rotasyonlar görünmeyen aralıklara girer ve model bozulur. Bowen Peng ve işbirlikçileri tarafından 2023 yılında piyasaya sürülen YaRN, bunu frekans başına uygulanan NTK uyumlu enterpolasyonla düzeltiyor: düşük frekanslı boyutları (uzun menzilli konumu izleyen) enterpolasyon yaparken (yerel, kısa menzilli ilişkileri yakalayan) yüksek frekanslı boyutları çoğunlukla dokunulmadan bırakıyor. YaRN ayrıca daha uzun bağlamlardan kaynaklanan entropi değişikliklerine karşı koymak için dikkati bir sıcaklık ayarına da ekler. Sonuç, verilerin yalnızca küçük bir kısmında ince ayar yapıldıktan ve basit yaklaşımların gerektirdiği adımların ardından güçlü uzun bağlam performansıdır.

Teknik Bilgi

RoPE her gömme boyutuna bir dönüş frekansı atar. Saf doğrusal enterpolasyon, tüm frekansları eşit şekilde sıkıştırarak ince yerel ayrıntıları kodlayan yüksek frekans boyutlarına zarar verir. YaRN, yüksek frekanslı olanları korurken yalnızca düşük frekanslı (uzun dalga boyu) boyutları enterpolasyona tabi tutmak için bir rampa işlevi ve ayrıca dizi uzunluğu arttıkça softmax keskinliğini sabit tutan 1/sqrt(t) dikkat sıcaklığı ölçeklendirmesi kullanır. Bu NTK parça parça yaklaşımı, bağlamı çok daha az bozulmayla genişletir.

YaRN ve Bağlam Uzunluğu Uzantısında Uzmanlaşma

YaRN (Yine başka bir RoPE uzantısı), bir modelin kullanılabilir bağlam penceresini üzerinde eğitim verildiğinin çok ötesine genişletmek için etkili bir tekniktir. Döner konum yerleştirmelerini akıllıca yeniden ölçeklendirir, böylece örneğin 4K jetonlar üzerinde eğitilmiş bir model, minimum ince ayar ile 32K veya daha fazlasını işleyebilir. YaRN ve Bağlam Uzunluğu Uzantısı, model kalitesini, altyapı maliyetini, gecikmeyi ve güvenilirliği geniş ölçekte etkileyen teknik bir yapı taşıdır. Derin bir anlayış oluşturmak için YaRN ve Bağlam Uzunluğu Uzantısını tek bir özellik olarak değil, bir işletim modeli olarak ele alın: istenen sonuçları tanımlayın, varsayımları netleştirin ve sistemin güvenilir bir şekilde yapabileceklerini hâlâ uzman görüşü gerektiren şeylerden ayırın.

Uygulamada, YaRN ve Bağlam Uzunluğu Uzantısını kullanan güçlü ekipler, mimariyi, verileri ve altyapı seçeneklerini güvenilirlik ve maliyete göre optimize eder. Açık başarı kriterlerini belgeliyorlar, gerçekçi verilere ve iş akışlarına göre test ediyorlar ve tek seferlik kıyaslama kazanımları yerine gözlemlenen başarısızlık modellerine dayalı olarak yineleniyorlar. Burası teorik anlayışın ürün, politika ve operasyonlar genelinde dayanıklı yeteneğe dönüştüğü yerdir.

Mimari kararlar yıllarca performansı ve işletme maliyetini etkiler. Aynı zamanda, bir kıyaslamayı optimize etmek daha geniş sistem zayıflıklarını gizleyebilir. En dayanıklı yaklaşım, deneme hızını yönetişim disiplini ile birleştirmektir: pilot uygulamaları çalıştırın, kanıtları toplayın, karar günlüklerini yayınlayın ve model davranışı, kullanıcı beklentileri ve düzenleyici gereksinimler geliştikçe koruma önlemlerini sürekli olarak güncelleyin.

Stratejik Etki

Mimari kararlar yıllarca performansı ve işletme maliyetini etkiler.

Mimari kararlar yıllarca performansı ve işletme maliyetini etkiler. Yüksek kaliteli dağıtımlarda bu, ölçülebilir işletim kurallarına, sahiplik sınırlarına ve yinelenen inceleme ritüellerine dönüştürülür, böylece ekipler belirsizliği ölçeklendirmek yerine güveni ölçeklendirebilir.

Teknik eğitim, ekiplerin yalnızca en yenisini değil, doğru yığını seçmesine de yardımcı olur.

Teknik eğitim, ekiplerin yalnızca en yenisini değil, doğru yığını seçmesine de yardımcı olur. Yüksek kaliteli dağıtımlarda bu, ölçülebilir işletim kurallarına, sahiplik sınırlarına ve yinelenen inceleme ritüellerine dönüştürülür, böylece ekipler belirsizliği ölçeklendirmek yerine güveni ölçeklendirebilir.

Daha iyi mühendislik seçenekleri, üretimdeki güvenilirlik olaylarını azaltır.

Daha iyi mühendislik seçenekleri, üretimdeki güvenilirlik olaylarını azaltır. Yüksek kaliteli dağıtımlarda bu, ölçülebilir işletim kurallarına, sahiplik sınırlarına ve yinelenen inceleme ritüellerine dönüştürülür, böylece ekipler belirsizliği ölçeklendirmek yerine güveni ölçeklendirebilir.

YaRN'nin Geleceği ve Bağlam Uzunluğu Uzantısı

Bağlam genişletme artık standart bir uygulamadır: Açık modeller rutin olarak 128K token veya ötesine ulaşan YaRN-genişletilmiş varyantları göndermektedir. Araştırma, bağlamı sıfır veya sıfıra yakın ince ayar ile genişleten, RoPE yeniden ölçeklendirmesini dikkat modeli hileleriyle birleştiren ve kaliteyi yalnızca uçlar yerine tüm pencere boyunca koruyan yöntemlere doğru ilerliyor. Bu tekniklerin ön eğitime daha sıkı entegre edilmesini bekleyin, böylece bağlam sonradan uyarlanmak yerine yerel olacaktır.

Gerçek Dünya Uygulaması

Kısa ince ayar ile uzun belgeli soru yanıtlaması için açık bir 4K bağlam modelini 32K veya 128K'ya genişletme

Alma destekli sistemlerin birçok birleştirilmiş pasajı kesme olmadan almasına olanak sağlama

Tek bir komut isteminde büyük bir depo dosyasının tamamına veya birden fazla dosyaya ihtiyaç duyan kod yardımcılarına güç verilmesi

Büyük sohbet geçmişlerini biriktiren uzun, çok turlu görüşmeler için temel bir modelin uyarlanması

Uygulama Modelleri

Uygulamada YaRN ve Bağlam Uzunluğu Uzantısı

Kısa ince ayar ile uzun belgeli soruların yanıtlanması için açık bir 4K bağlam modelini 32K veya 128K'ya genişletme.

Kısa ince ayar ile uzun belgeli soru yanıtları için açık bir 4K bağlam modelini 32K veya 128K'ya genişletme Ekipler genellikle kalite eşiklerini önceden belirlediklerinde, uç durumlar için insani bir yükseltme yolunu tuttuklarında ve zaman içinde hem üretkenlik kazanımlarını hem de hata maliyetlerini takip ettiklerinde daha iyi sonuçlar elde ederler.

Uygulamada YaRN ve Bağlam Uzunluğu Uzantısı

Alma destekli sistemlerin, birleştirilmiş birçok pasajı kesme olmadan almasına olanak sağlanması.

Erişimle zenginleştirilmiş sistemlerin, birleştirilmiş birçok pasajı kesmeden almasına olanak sağlanması Ekipler, kalite eşiklerini önceden tanımladıklarında, uç durumlar için insani bir yükseltme yolu tuttuklarında ve zaman içinde hem üretkenlik kazanımlarını hem de hata maliyetlerini takip ettiklerinde genellikle daha iyi sonuçlar elde ederler.

Uygulamada YaRN ve Bağlam Uzunluğu Uzantısı

Tek bir istemde büyük bir depo dosyasının tamamına veya birden fazla dosyaya ihtiyaç duyan kod yardımcılarına güç verilmesi.

Tek bir komut isteminde büyük bir depo dosyasının tamamına veya birden fazla dosyaya ihtiyaç duyan kod yardımcılarına güç verilmesi Ekipler genellikle kalite eşiklerini önceden belirlediklerinde, uç durumlar için insani bir yükseltme yolunu tuttuklarında ve zaman içinde hem üretkenlik kazanımlarını hem de hata maliyetlerini izlediklerinde daha iyi sonuçlar elde ederler.

Uygulamada YaRN ve Bağlam Uzunluğu Uzantısı

Büyük sohbet geçmişlerini biriktiren uzun, çok turlu görüşmeler için temel bir modelin uyarlanması.

Büyük sohbet geçmişlerini biriktiren uzun, çok turlu görüşmeler için temel bir modeli uyarlama Ekipler genellikle kalite eşiklerini önceden belirlediklerinde, uç durumlar için insani bir yükseltme yolunu tuttuklarında ve zaman içinde hem üretkenlik kazanımlarını hem de hata maliyetlerini takip ettiklerinde daha iyi sonuçlar elde ederler.

Riskler ve Korkuluklar

!

Bir kıyaslamayı optimize etmek daha geniş sistem zayıflıklarını gizleyebilir.

!

Altyapı ve bakım maliyetleri genellikle hafife alınır.

!

Sistemler karmaşıklaştıkça güvenlik ve gözlemlenebilirlik boşlukları büyüyebilir.

Uygulama Yol Haritası

1

Uygulamadan önce gecikmeyi, kaliteyi ve maliyet hedeflerini tanımlayın.

Uygulamadan önce gecikmeyi, kaliteyi ve maliyet hedeflerini tanımlayın. Her adımı bir kanıt kapısı olarak değerlendirin: Kriterler karşılanmazsa, kullanıma sunumu duraklatın, boşluğu kapatın ve ancak bundan sonra kullanımı genişletin.

2

Gerçekçi yük ve veri koşulları altında kıyaslama yapın.

Gerçekçi yük ve veri koşulları altında kıyaslama yapın. Her adımı bir kanıt kapısı olarak değerlendirin: Kriterler karşılanmazsa, kullanıma sunumu duraklatın, boşluğu kapatın ve ancak bundan sonra kullanımı genişletin.

3

Hatalar, sapmalar ve kullanıcı etkisi için cihaz izleme.

Hatalar, sapmalar ve kullanıcı etkisi için cihaz izleme. Her adımı bir kanıt kapısı olarak değerlendirin: Kriterler karşılanmazsa, kullanıma sunumu duraklatın, boşluğu kapatın ve ancak bundan sonra kullanımı genişletin.

4

Ölçeklendirmeden önce geri alma ve olay müdahale yollarını hazırlayın.

Ölçeklendirmeden önce geri alma ve olay müdahale yollarını hazırlayın. Her adımı bir kanıt kapısı olarak değerlendirin: Kriterler karşılanmazsa, kullanıma sunumu duraklatın, boşluğu kapatın ve ancak bundan sonra kullanımı genişletin.

Keşfetmeye Devam Edin