የቴክኒክ መመሪያ

KServe እና ሞዴል በኩበርኔትስ ማገልገል

KServe የማሽን መማሪያ ሞዴሎችን በመጠን ለማገልገል ደረጃውን የጠበቀ የኩበርኔትስ ተወላጅ መድረክ ነው።

አጠቃላይ እይታ

KServe የማሽን መማሪያ ሞዴሎችን በመጠን ለማገልገል ደረጃውን የጠበቀ የኩበርኔትስ ተወላጅ መድረክ ነው። ለቡድኖች አንድ ነጠላ ገላጭ መንገድ በአውቶስካሊንግ፣ በካናሪ ልቀቶች እና በመጠን ወደ ዜሮ የሚወስዱ ሲሆን ይህም አብዛኛዎቹን የኩበርኔትስ ቧንቧዎችን ያስወግዳል።

KServe እና ሞዴል በኩበርኔትስ ላይ ማገልገል የሞዴል ጥራትን፣ የመሠረተ ልማት ወጪን፣ መዘግየትን እና አስተማማኝነትን የሚነካ ቴክኒካል ግንባታ ነው።

ጥልቅ ዳይቭ

ቀደም ሲል KFServing በመባል የሚታወቀው እና ከ Kubeflow ፕሮጀክት የተወለደ፣ KServe የኢንፈረንስ አገልግሎት ብጁ ግብዓት ይገልፃል። በነገር ማከማቻ (S3፣ GCS፣ Azure Blob) ውስጥ በተከማቸ ሞዴል ላይ አጭር የ YAML ፋይል ይጽፋሉ፣ እና KServe ቀሪውን ይይዛል። ሁለቱንም ግምታዊ ግምት እና፣ እየጨመረ፣ አመንጪ LLM አገልግሎትን ይደግፋል። KServe ለጋራ ማዕቀፎች (TensorFlow Serving, TorchServe, Triton, scikit-learn, XGBoost, Hugging Face) ቀድመው የተገነቡ እና ብጁ ኮንቴይነሮችን ይደግፋል። ከKnative Serving እና ከአውታረ መረብ ንብርብር (ኢስቲዮ ወይም ተመሳሳይ) በላይ የተገነባው በጥያቄ የሚመራ አውቶማቲክ ሚዛን ከዜሮ እስከ ዜሮን ጨምሮ በጥያቄ የሚመራ አውቶማቲክን ያቀርባል፣ ስለዚህ ስራ ፈት ሞዴሎች ምንም ስሌት አይጠቀሙም። እንዲሁም የትንበያ ኤፒአይን በOpen Inference Protocol ዙሪያ ደረጃውን የጠበቀ ነው፣ ስለዚህ ደንበኞቻቸው ምንም አይነት ማዕቀፍ ቢኖራቸውም ለእያንዳንዱ ሞዴል በተመሳሳይ መንገድ ይነጋገራሉ።

ቴክኒካዊ ግንዛቤ

የKServe አውቶማቲካሊንግ በKnative ላይ ዘንበል ይላል፣ ይህም በተዛማጅነት ወይም በጥያቄዎች በሰከንድ የተባዛ ቁጥርን የሚለካው እና ትራፊክ ሲቆም ወደ ዜሮ ቅጂዎች ሊወርድ ይችላል፣ ከዚያም በፍላጎት ይጀምራል። የ Inference አገልግሎት ሙሉ የማጣቀሻ ቧንቧን ወደ ትንበያ፣ ትራንስፎርመር (ቅድመ/ድህረ-ሂደት) እና ገላጭ አካላት ያዘጋጃል። ሞዴሎች ከዕቃ ማከማቻው በ'ማከማቻ ማስጀመሪያ' በኩል ይጫናሉ፣ በጅምር ላይ ቅርሶችን ወደ ፖድ ውስጥ ይጎትቱ፣ የሞዴል ማከማቻን ከማገልገያ መያዣ ምስል ላይ በማላቀቅ።

በ Kubernetes ላይ KServe እና ሞዴል ማገልገልን ማስተማር

KServe የማሽን መማሪያ ሞዴሎችን በመጠን ለማገልገል ደረጃውን የጠበቀ የኩበርኔትስ ተወላጅ መድረክ ነው። ለቡድኖች አንድ ነጠላ ገላጭ መንገድ በአውቶስካሊንግ፣ በካናሪ ልቀቶች እና በመጠን ወደ ዜሮ የሚወስዱ ሲሆን ይህም አብዛኛዎቹን የኩበርኔትስ ቧንቧዎችን ያስወግዳል። KServe እና ሞዴል በኩበርኔትስ ላይ ማገልገል የሞዴል ጥራትን፣ የመሠረተ ልማት ወጪን፣ መዘግየትን እና አስተማማኝነትን የሚነካ ቴክኒካል ግንባታ ነው። ጥልቅ ግንዛቤን ለመገንባት KServe እና Model Serving on Kubernetes እንደ ኦፕሬሽን ሞዴል ያዙ እንጂ አንድ ባህሪ አይደለም፡ የተፈለገውን ውጤት ይግለጹ፣ ግምቶችን ያብራሩ እና ስርዓቱ አሁንም የባለሙያዎችን ፍርድ ከሚያስፈልገው ለይ።

በተግባር፣ KServe እና Model Serving on Kubernetes የሚጠቀሙ ጠንካራ ቡድኖች አርክቴክቸርን፣ መረጃን እና የመሰረተ ልማት ምርጫዎችን ከአስተማማኝነት እና ከወጪ ጋር ያሻሽላሉ። ግልጽ የስኬት መስፈርቶችን ይመዘግባሉ፣ በተጨባጭ መረጃ እና የስራ ፍሰቶች ላይ ይፈትሻሉ፣ እና የአንድ ጊዜ ቤንችማርክ ከማሸነፍ ይልቅ በተስተዋሉ የውድቀት ቅጦች ላይ ተመስርተው ይደግማሉ። ይህ የንድፈ ሃሳባዊ ግንዛቤ በምርት፣ ፖሊሲ እና ኦፕሬሽኖች ላይ ወደ ዘላቂ አቅም የሚቀየርበት ነው።

የስነ-ህንፃ ውሳኔዎች ለዓመታት አፈጻጸምን እና የሥራ ማስኬጃ ወጪዎችን ያንቀሳቅሳሉ. በተመሳሳይ ጊዜ፣ አንድ ቤንችማርክን ማሻሻል ሰፋ ያሉ የስርዓት ድክመቶችን መደበቅ ይችላል። በጣም ጠንካራው አካሄድ የሙከራ ፍጥነትን ከአስተዳደር ዲሲፕሊን ጋር ማጣመር ነው፡ አብራሪዎችን ማስኬድ፣ ማስረጃን መያዝ፣ የውሳኔ ምዝግብ ማስታወሻዎችን ማተም እና የሞዴል ባህሪ፣ የተጠቃሚ የሚጠበቁ እና የቁጥጥር መስፈርቶች ሲዳብሩ ጥበቃዎችን ያለማቋረጥ ማዘመን ነው።

ስልታዊ ተጽእኖ

የስነ-ህንፃ ውሳኔዎች ለዓመታት አፈጻጸምን እና የሥራ ማስኬጃ ወጪዎችን ያንቀሳቅሳሉ.

የስነ-ህንፃ ውሳኔዎች ለዓመታት አፈጻጸምን እና የሥራ ማስኬጃ ወጪዎችን ያንቀሳቅሳሉ. ከፍተኛ ጥራት ባለው ማሰማራት ውስጥ፣ ይህ ወደሚለካ የአሠራር ደንቦች፣ የባለቤትነት ወሰኖች እና ተደጋጋሚ የግምገማ ሥነ ሥርዓቶች ይተረጎማል ስለዚህ ቡድኖች አሻሚነትን ከማስፋት ይልቅ በራስ መተማመንን ሊጨምሩ ይችላሉ።

የቴክኒክ ትምህርት ቡድኖች አዲሱን ብቻ ሳይሆን ትክክለኛውን ቁልል እንዲመርጡ ይረዳል።

የቴክኒክ ትምህርት ቡድኖች አዲሱን ብቻ ሳይሆን ትክክለኛውን ቁልል እንዲመርጡ ይረዳል። ከፍተኛ ጥራት ባለው ማሰማራት ውስጥ፣ ይህ ወደሚለካ የአሠራር ደንቦች፣ የባለቤትነት ወሰኖች እና ተደጋጋሚ የግምገማ ሥነ ሥርዓቶች ይተረጎማል ስለዚህ ቡድኖች አሻሚነትን ከማስፋት ይልቅ በራስ መተማመንን ሊጨምሩ ይችላሉ።

የተሻሉ የምህንድስና ምርጫዎች በምርት ውስጥ አስተማማኝነት ክስተቶችን ይቀንሳሉ.

የተሻሉ የምህንድስና ምርጫዎች በምርት ውስጥ አስተማማኝነት ክስተቶችን ይቀንሳሉ. ከፍተኛ ጥራት ባለው ማሰማራት ውስጥ፣ ይህ ወደሚለካ የአሠራር ደንቦች፣ የባለቤትነት ወሰኖች እና ተደጋጋሚ የግምገማ ሥነ ሥርዓቶች ይተረጎማል ስለዚህ ቡድኖች አሻሚነትን ከማስፋት ይልቅ በራስ መተማመንን ሊጨምሩ ይችላሉ።

የKServe የወደፊት እና ሞዴል በኩበርኔትስ ላይ ማገልገል

KServe እንደ KV-cache-aware routeing፣ሞዴል መሸጎጫ፣እና የተዋሃደ ቅድመ-ሙላ/መግለጫ ለትልቅ ቋንቋ ሞዴሎች ያሉ ባህሪያትን የያዘ LLM ላይ ያተኮረ ትራክ በማከል ወደ ጀነሬቲቭ AI በፍጥነት እያደገ ነው። እንደ vLLM ካሉ ኢንቬንሽን ሞተሮች ጋር ጠለቅ ያለ ውህደትን ይጠብቁ፣ ለአንድ ጂፒዩ በጣም ትልቅ ለሆኑ ሞዴሎች የተሻሉ ባለብዙ-ኖድ አገልግሎት እና በቶከን ላይ የተመሰረተ ጭነት ማመጣጠን። እንደ CNCF-incubating ፕሮጀክት፣ ሞዴሎችን ከኩበርኔትስ ጀርባ ለማስቀመጥ፣ በምርምር ቅርሶች እና ተከላካይ በሆኑ የምርት የመጨረሻ ነጥቦች መካከል ያለውን ልዩነት በማጥበብ ዋናው ክፍት መስፈርት እየሆነ ነው።

የእውነተኛ-ዓለም አተገባበር

አንድ ባንክ ባለ 10-መስመር InferenceService YAML በS3 ውስጥ ያለውን ሞዴል በመጠቆም የክሬዲት ነጥብ ማስመዝገቢያ ሞዴልን በ KServe አያያዝ አውቶማቲካሊንግ እና መግባትን ያሰማራል።

የኢ-ኮሜርስ ቡድን 10 በመቶ ትራፊክ ወደ አዲስ የጥቆማ ሞዴል ለመላክ የKServe canary rollouts ይጠቀማል፣ ከዚያ መለኪያዎች ጤናማ ሆነው ሲታዩ ወደ 100 በመቶ ይደርሳል።

የምርምር ላብራቶሪ በደርዘን የሚቆጠሩ እምብዛም ጥቅም ላይ ያልዋሉ ሞዴሎችን ከደረጃ ወደ ዜሮ ያገለግላል፣ ስለዚህ እያንዳንዱ ሞዴል የሚሽከረከረው ጥያቄ ሲመጣ ብቻ ነው እና ስራ ፈት እያለ ጂፒዩ አይጠቀምም።

የMLOps ቡድን የምስል መጠን መቀየር እና መደበኛ ማድረግን ለማስኬድ የMLOps ቡድን በትሪቶን የቀረበ የእይታ ሞዴልን ከማስኬዱ በፊት የKServe ትራንስፎርመር አካልን ይጠቀማል።

የትግበራ ቅጦች

KServe እና ሞዴል በተግባር በኩበርኔትስ ማገልገል

አንድ ባንክ ባለ 10-መስመር InferenceService YAML በS3 ውስጥ ያለውን ሞዴል በመጠቆም የክሬዲት ነጥብ ማስመዝገቢያ ሞዴልን በ KServe አያያዝ አውቶማቲካሊንግ እና መግባትን ያሰማራል።

አንድ ባንክ ባለ 10-መስመር InferenceService YAML በS3 ውስጥ ያለውን ሞዴል በመጥቀስ የክሬዲት ነጥብ መስጫ ሞዴልን ያሰማራል። KServe አውቶማቲክ ማድረጊያ እና ማስገቢያ ቡድኖች ብዙውን ጊዜ የጥራት ደረጃዎችን ፊት ለፊት ሲገልጹ የተሻለ ውጤት ያገኛሉ፣ ለዳር ጉዳዮች የሰው ልጅ እድገት መንገድን ይጠብቁ እና ሁለቱንም የምርታማነት ግኝቶችን እና የስህተት ወጪዎችን በጊዜ ሂደት ይከታተላሉ።

KServe እና ሞዴል በተግባር በኩበርኔትስ ማገልገል

የኢ-ኮሜርስ ቡድን 10 በመቶ ትራፊክ ወደ አዲስ የጥቆማ ሞዴል ለመላክ የKServe canary rollouts ይጠቀማል፣ ከዚያ መለኪያዎች ጤናማ ሆነው ሲታዩ ወደ 100 በመቶ ይደርሳል።

የኢ-ኮሜርስ ቡድን 10 በመቶ የሚሆነውን ትራፊክ ወደ አዲስ የጥቆማ ሞዴል ለመላክ የ KServe canary rolloutsን ይጠቀማል፣ ከዚያ ወደ 100 ፐርሰንት ከፍ ይላል አንዴ መለኪያዎች ጤናማ ሆነው ሲታዩ ቡድኖች ብዙውን ጊዜ የጥራት ደረጃዎችን ሲወስኑ የተሻለ ውጤት ያገኛሉ፣ ለዳር ጉዳዮች የሰው ልጅ እድገት መንገድን ይጠብቁ እና ሁለቱንም የምርታማነት ትርፍ እና የስህተት ወጪዎችን በጊዜ ሂደት ይከታተላሉ።

KServe እና ሞዴል በተግባር በኩበርኔትስ ማገልገል

የምርምር ላብራቶሪ በደርዘን የሚቆጠሩ እምብዛም ጥቅም ላይ ያልዋሉ ሞዴሎችን ከደረጃ ወደ ዜሮ ያገለግላል፣ ስለዚህ እያንዳንዱ ሞዴል የሚሽከረከረው ጥያቄ ሲመጣ ብቻ ነው እና ስራ ፈት እያለ ጂፒዩ አይጠቀምም።

የምርምር ላብራቶሪ በደርዘን የሚቆጠሩ እምብዛም ጥቅም ላይ ያልዋሉ ሞዴሎችን ከዜሮ ወደ ዜሮ ያገለግላል፣ ስለዚህ እያንዳንዱ ሞዴል የሚሽከረከረው ጥያቄ ሲመጣ ብቻ ነው እና ምንም ጂፒዩ አይጠቀምም ፣ ስራ ፈት ቡድኖች ብዙውን ጊዜ የጥራት ደረጃዎችን ፊት ለፊት ሲገልጹ የተሻለ ውጤት ያገኛሉ ፣ ለጫፍ ጉዳዮች የሰውን እድገት መንገድ ይጠብቃሉ እና ሁለቱንም የምርታማነት ግኝቶችን እና የስህተት ወጪዎችን በጊዜ ሂደት ይከታተላሉ።

KServe እና ሞዴል በተግባር በኩበርኔትስ ማገልገል

የMLOps ቡድን የምስል መጠን መቀየር እና መደበኛ ማድረግን ለማስኬድ የMLOps ቡድን በትሪቶን የቀረበ የእይታ ሞዴልን ከማስኬዱ በፊት የKServe ትራንስፎርመር አካልን ይጠቀማል።

የ MLOps ቡድን የ KServe ትራንስፎርመር አካልን ይጠቀማል ተንታኙ በትሪቶን ያገለገሉ የእይታ ሞዴልን ከማስኬዱ በፊት የምስል መጠንን እና መደበኛነትን ለማስኬድ ቡድኖች ብዙውን ጊዜ የጥራት ደረጃዎችን ከፊት ሲወስኑ የተሻለ ውጤት ያገኛሉ ፣ ለጫፍ ጉዳዮች የሰውን እድገት መንገድ ይጠብቃሉ እና ሁለቱንም የምርታማነት ግኝቶችን እና የስህተት ወጪዎችን በጊዜ ሂደት ይከታተላሉ።

አደጋዎች እና የጥበቃ መንገዶች

!

አንድ ቤንችማርክን ማሳደግ ሰፋ ያሉ የስርዓት ድክመቶችን ሊደብቅ ይችላል።

!

የመሠረተ ልማት እና የጥገና ወጪዎች ብዙ ጊዜ ዝቅተኛ ናቸው.

!

ስርዓቶች ይበልጥ ውስብስብ ሲሆኑ የደህንነት እና የታዛቢነት ክፍተቶች ሊያድጉ ይችላሉ።

የትግበራ ፍኖተ ካርታ

1

ከመተግበሩ በፊት የቆይታ፣ የጥራት እና የወጪ ግቦችን ይግለጹ።

ከመተግበሩ በፊት የቆይታ፣ የጥራት እና የወጪ ግቦችን ይግለጹ። እያንዳንዱን እርምጃ እንደማስረጃ በር ያዙት፡ መመዘኛዎቹ ካልተሟሉ፣ መልቀቅን ለአፍታ አቁም፣ ክፍተቱን ይዝጉ እና ከዚያ ብቻ አጠቃቀምን ያስፋፉ።

2

ቤንችማርክ በእውነተኛ ጭነት እና የውሂብ ሁኔታዎች።

ቤንችማርክ በእውነተኛ ጭነት እና የውሂብ ሁኔታዎች። እያንዳንዱን እርምጃ እንደማስረጃ በር ያዙት፡ መመዘኛዎቹ ካልተሟሉ፣ መልቀቅን ለአፍታ አቁም፣ ክፍተቱን ይዝጉ እና ከዚያ ብቻ አጠቃቀምን ያስፋፉ።

3

ለስህተቶች፣ ተንሸራታች እና የተጠቃሚ ተጽእኖ የመሳሪያ ክትትል።

ለስህተቶች፣ ተንሸራታች እና የተጠቃሚ ተጽእኖ የመሳሪያ ክትትል። እያንዳንዱን እርምጃ እንደማስረጃ በር ያዙት፡ መመዘኛዎቹ ካልተሟሉ፣ መልቀቅን ለአፍታ አቁም፣ ክፍተቱን ይዝጉ እና ከዚያ ብቻ አጠቃቀምን ያስፋፉ።

4

ከመጠኑ በፊት የመመለሻ እና የአደጋ ምላሽ መንገዶችን ያዘጋጁ።

ከመጠኑ በፊት የመመለሻ እና የአደጋ ምላሽ መንገዶችን ያዘጋጁ። እያንዳንዱን እርምጃ እንደማስረጃ በር ያዙት፡ መመዘኛዎቹ ካልተሟሉ፣ መልቀቅን ለአፍታ አቁም፣ ክፍተቱን ይዝጉ እና ከዚያ ብቻ አጠቃቀምን ያስፋፉ።

ማሰስዎን ይቀጥሉ