የቋንቋ AI መመሪያ

ሕገ-መንግሥታዊ AI

ሕገ-መንግሥታዊ AI የAnthropic ሞዴሎችን በጽሑፍ የተጻፉ መርሆዎችን በመጠቀም የማጣጣም ዘዴ ነው - 'ሕገ መንግሥት' - ስለዚህ AI በሰዎች ላይ ብቻ ከመተማመን ይልቅ ጎጂ ይዘትን ለመሰየም የራሱን መልሶች ይወቅሳል እና ያስተካክላል።

አጠቃላይ እይታ

ሕገ-መንግሥታዊ AI የAnthropic ሞዴሎችን በጽሑፍ የተጻፉ መርሆዎችን በመጠቀም የማጣጣም ዘዴ ነው - 'ሕገ መንግሥት' - ስለዚህ AI በሰዎች ላይ ብቻ ከመተማመን ይልቅ ጎጂ ይዘትን ለመሰየም የራሱን መልሶች ይወቅሳል እና ያስተካክላል። በጣም ያነሰ የሰው ጉልበት በመጠቀም ሞዴሎችን አጋዥ እና ምንም ጉዳት የሌላቸው እንዲሆኑ ለማድረግ ያለመ ነው።

ሕገ መንግሥታዊ AI የቋንቋ-AI ቁልል አካል ነው ጽሑፍን እና ንግግርን በሚዛን መጠን ለማንበብ፣ ለማፍለቅ፣ ለመከፋፈል እና ለመለወጥ።

ጥልቅ ዳይቭ

ተለምዷዊ አሰላለፍ ከሰዎች ግብረመልስ (RLHF) በማጠናከሪያ ትምህርት ላይ ያደገ ሲሆን ሰዎች ሞዴሉን ምን መራቅ እንዳለበት ለማስተማር የሚረብሹን ጨምሮ ብዙ የሞዴል ውጤቶችን ደረጃ በሚሰጡበት ነው። ሕገ መንግሥታዊ AI እንደ የተባበሩት መንግስታት የሰብአዊ መብቶች መግለጫ እና የመተማመን እና የደህንነት ምርጥ ልምዶች ካሉ ምንጮች የተውጣጡ ግልጽ የጽሁፍ መርሆዎችን ለአምሳያው በመስጠት ሸክሙን ይቀንሳል። ስልጠና ሁለት ደረጃዎች አሉት. በመጀመሪያ ደረጃ, ቁጥጥር የሚደረግበት ደረጃ: ሞዴሉ ምላሽ ያመነጫል, ከዚያም በህገ-መንግስታዊ መርህ ላይ ይወቅሰዋል እና የተሻለ እንዲሆን እንደገና ይጽፋል; እነዚህ በራሳቸው የተሻሻሉ መልሶች እሱን ለማስተካከል ይጠቅማሉ። ሁለተኛ፣ የማጠናከሪያ-ትምህርት ደረጃ፣ RLAIF፣ ሞዴሉ እራሱ በህገ-መንግስቱ መሰረት ጥንድ ምላሾችን ያስቀመጠበት፣ እና በ AI የመነጨ ምርጫ መረጃ የሽልማት ሞዴልን ያሠለጥናል። መርሆቹ ግልጽ እና አርትዖት ሊደረጉ የሚችሉ ናቸው፣ ይህም ሞዴሉን የሚመራው እሴት ግልጽ ባልሆኑ የሰው መለያዎች ውስጥ ከመደበቅ ይልቅ መፈተሽ እንዲችል ያደርገዋል።

ቴክኒካዊ ግንዛቤ

ሁለቱ ደረጃዎች ብዙውን ጊዜ SL-CAI እና RL-CAI ይባላሉ። ክትትል በሚደረግበት ትምህርት፣ 'ሂስ-እና-ክለሳ' ሉፕ ሞዴሉን የራሱ መልስ ናሙና የሆነን መርህ የሚጥስበትን ቦታ ፈልጎ እንዲያገኝ እና እንደገና እንዲጽፈው ያነሳሳዋል፣ ይህም የሰው ጉዳት-መለያ ሳይደረግበት የሥልጠና መረጃ ያመነጫል። በአርኤል ደረጃ፣ ሁለተኛው ሞዴል ከሁለቱ ምላሾች የትኛው በተሻለ ሁኔታ ሕገ መንግሥቱን እንደሚከተል ይገመግማል፣ ይህም በመደበኛ RL ውስጥ ጥቅም ላይ የዋለውን የሽልማት ሞዴል የሚያሠለጥኑ የ AI ምርጫ መለያዎችን (RLAIF) ያዘጋጃል። ሕገ መንግሥቱ ግልጽ የሆነ የጽሑፍ መመሪያ ነው፣ ስለዚህ የአምሳያው ባህሪ መቀየር መርሆችን እንደማረም ቀጥተኛ ሊሆን ይችላል።

ሕገ መንግሥታዊ AIን መቆጣጠር

ሕገ-መንግሥታዊ AI የAnthropic ሞዴሎችን በጽሑፍ የተጻፉ መርሆዎችን በመጠቀም የማጣጣም ዘዴ ነው - 'ሕገ መንግሥት' - ስለዚህ AI በሰዎች ላይ ብቻ ከመተማመን ይልቅ ጎጂ ይዘትን ለመሰየም የራሱን መልሶች ይወቅሳል እና ያስተካክላል። በጣም ያነሰ የሰው ጉልበት በመጠቀም ሞዴሎችን አጋዥ እና ምንም ጉዳት የሌላቸው እንዲሆኑ ለማድረግ ያለመ ነው። ሕገ መንግሥታዊ AI የቋንቋ-AI ቁልል አካል ነው ጽሑፍን እና ንግግርን በሚዛን መጠን ለማንበብ፣ ለማፍለቅ፣ ለመከፋፈል እና ለመለወጥ። ጥልቅ ግንዛቤን ለመገንባት ሕገ መንግሥታዊ AIን እንደ ኦፕሬሽን ሞዴል ያዙ እንጂ አንድ ባህሪ አይደለም፡ የሚፈለጉትን ውጤቶች ይግለጹ፣ ግምቶችን ያብራሩ፣ እና ስርዓቱ አሁንም የባለሙያዎችን ፍርድ ከሚያስፈልገው ነገር ለይ።

በተግባር፣ ሕገ መንግሥታዊ AI ንድፍ አነሳሶችን፣ ሰርስሮ ማውጣት እና የግምገማ ቀለበቶችን እንደ አንድ የተቀናጀ የግንኙነት ሥርዓት የሚጠቀሙ ጠንካራ ቡድኖች። ግልጽ የስኬት መስፈርቶችን ይመዘግባሉ፣ በተጨባጭ መረጃ እና የስራ ፍሰቶች ላይ ይፈትሻሉ፣ እና የአንድ ጊዜ ቤንችማርክ ከማሸነፍ ይልቅ በተስተዋሉ የውድቀት ቅጦች ላይ ተመስርተው ይደግማሉ። ይህ የንድፈ ሃሳባዊ ግንዛቤ በምርት፣ ፖሊሲ እና ኦፕሬሽኖች ላይ ወደ ዘላቂ አቅም የሚቀየርበት ነው።

የቋንቋ የስራ ፍሰቶች ወጥነትን ሳያጠፉ በፍጥነት ሊንቀሳቀሱ ይችላሉ። በተመሳሳይ ጊዜ፣ የተሳሳቱ እውነታዎች ሪፖርቶችን፣ የድጋፍ ፍሰቶችን ወይም የምርምር ውጤቶችን በጸጥታ ማስገባት ይችላሉ። በጣም ጠንካራው አካሄድ የሙከራ ፍጥነትን ከአስተዳደር ዲሲፕሊን ጋር ማጣመር ነው፡ አብራሪዎችን ማስኬድ፣ ማስረጃን መያዝ፣ የውሳኔ ምዝግብ ማስታወሻዎችን ማተም እና የሞዴል ባህሪ፣ የተጠቃሚ የሚጠበቁ እና የቁጥጥር መስፈርቶች ሲዳብሩ ጥበቃዎችን ያለማቋረጥ ማዘመን ነው።

ስልታዊ ተጽእኖ

የቋንቋ የስራ ፍሰቶች ወጥነትን ሳያጠፉ በፍጥነት ሊንቀሳቀሱ ይችላሉ።

የቋንቋ የስራ ፍሰቶች ወጥነትን ሳያጠፉ በፍጥነት ሊንቀሳቀሱ ይችላሉ። ከፍተኛ ጥራት ባለው ማሰማራት ውስጥ፣ ይህ ወደሚለካ የአሠራር ደንቦች፣ የባለቤትነት ወሰኖች እና ተደጋጋሚ የግምገማ ሥነ ሥርዓቶች ይተረጎማል ስለዚህ ቡድኖች አሻሚነትን ከማስፋት ይልቅ በራስ መተማመንን ሊጨምሩ ይችላሉ።

በሁሉም ቋንቋዎች እና የግንኙነት ዘይቤዎች ተደራሽነትን ያሰፋል።

በሁሉም ቋንቋዎች እና የግንኙነት ዘይቤዎች ተደራሽነትን ያሰፋል። ከፍተኛ ጥራት ባለው ማሰማራት ውስጥ፣ ይህ ወደሚለካ የአሠራር ደንቦች፣ የባለቤትነት ወሰኖች እና ተደጋጋሚ የግምገማ ሥነ ሥርዓቶች ይተረጎማል ስለዚህ ቡድኖች አሻሚነትን ከማስፋት ይልቅ በራስ መተማመንን ሊጨምሩ ይችላሉ።

አውቶሜሽን ድግግሞሹን ሲቆጣጠር ቡድኖች በፍርድ ላይ ብዙ ጊዜ ሊያጠፉ ይችላሉ።

አውቶሜሽን ድግግሞሹን ሲቆጣጠር ቡድኖች በፍርድ ላይ ብዙ ጊዜ ሊያጠፉ ይችላሉ። ከፍተኛ ጥራት ባለው ማሰማራት ውስጥ፣ ይህ ወደሚለካ የአሠራር ደንቦች፣ የባለቤትነት ወሰኖች እና ተደጋጋሚ የግምገማ ሥነ ሥርዓቶች ይተረጎማል ስለዚህ ቡድኖች አሻሚነትን ከማስፋት ይልቅ በራስ መተማመንን ሊጨምሩ ይችላሉ።

የሕገ-መንግስታዊ AI የወደፊት

ሕገ መንግሥታዊ AI ወደ 'ተመጣጣኝ ቁጥጥር' ይጠቁማል፣ ኤአይኤአይአይን ለመቆጣጠር የሚረዳበት ሞዴሎች ሰዎች እያንዳንዱን ምርት ለመፈተሽ በጣም አቅም እያደጉ ሲሄዱ ነው። የበለጠ የበለጸጉ፣ ይበልጥ ግልጽ ያልሆኑ ሕገ መንግሥቶች፣ መርሆች የሚመረጡባቸው ህዝባዊ እና አሳታፊ ግብዓቶችን ይጠብቁ (Anthropic 'የጋራ ሕገ መንግሥታዊ AI' ሙከራዎችን አድርጓል)፣ እና ድብልቅ አቀራረቦች የሰውን አስተያየት ከ AI ራስን ትችት ጋር ያዋህዳሉ። የጽሑፍ መርሆች ግልጽነት ይህንን ሥርዓት የሚመሰጥርባቸውን እሴቶች ለማየት ለሚፈልጉ ተቆጣጣሪዎች እና ኦዲተሮች ማራኪ ያደርገዋል። የድንበር ሞዴሎች እየገፉ ሲሄዱ፣ ሞዴሎች በአስተማማኝ ሁኔታ እንዲተቹ እና እራሳቸውን በግልፅ ህጎች ላይ እንዲያሻሽሉ የሚያደርጉ ዘዴዎች ለደህንነት ማዕከላዊ ይሆናሉ።

የእውነተኛ-ዓለም አተገባበር

አንድ ቻትቦት የራሱን ረቂቅ መልስ ከጉዳት-መራቅ መርህ ላይ በመተቸት መሳሪያ ለመስራት እንዳይረዳ ማሰልጠን እና እንደገና እንዲፃፍ ማድረግ

በህገ መንግስቱ በሚመራው ውድ የሰው ቀይ ቡድን የመርዛማ ውጤቶች መለያ በ AI የመነጨ ምርጫ መረጃ (RLAIF) መተካት

አንድ ሞዴል ምን ያህል ጠንቃቃ እንደሆነ ለማስተካከል የጽሑፍ መርሆ ማረም፣ ከዚያም በሺዎች የሚቆጠሩ ምሳሌዎችን ሳያስቀምጡ የባህሪ ለውጥን መመልከት

የአምሳያው ሕገ መንግሥትን የሚቀርጹ መርሆችን ሕዝቡ የሚያቀርብበት የጋራ ግብዓት ልምምዶችን ማካሄድ

የትግበራ ቅጦች

ሕገ-መንግሥታዊ AI በተግባር

አንድ ቻትቦት የራሱን ረቂቅ መልስ ከጉዳት-መራቅ መርህ ላይ በመተቸት መሳሪያውን ለመስራት እንዳይረዳ ማሰልጠን እና እንደገና እንዲፃፍ ማድረግ።

አንድ ቻትቦት የራሱን ረቂቅ መልስ ከጉዳት-መራቅ መርህ ላይ በመተቸት እና እንደገና እንዲፃፍ በማድረግ መሳሪያ ለመስራት እንዳይረዳ ማሰልጠን ቡድኖች ብዙውን ጊዜ የጥራት ደረጃዎችን ፊት ለፊት ሲገልጹ የተሻሉ ውጤቶችን ያገኛሉ ፣ ለጫፍ ጉዳዮች የሰውን እድገት መንገድ ያቆዩ እና ሁለቱንም የምርታማነት ትርፍ እና የስህተት ወጪዎችን በጊዜ ሂደት ይከታተላሉ።

ሕገ-መንግሥታዊ AI በተግባር

በህገ መንግስቱ በሚመራው ውድ የሰው ቀይ ቡድን የመርዛማ ውጤቶች መለያ በ AI የመነጨ ምርጫ መረጃ (RLAIF) መተካት።

በህገ መንግስቱ የሚመራ ውድ የሰው ቀይ ቡድን የመርዛማ ውጤቶች መለያን በ AI የመነጨ ምርጫ ዳታ (RLAIF) መተካት ቡድኖቹ አብዛኛውን ጊዜ የጥራት ደረጃዎችን ፊት ለፊት ሲገልጹ የተሻለ ውጤት ያገኛሉ፣ ለዳር ጉዳዮች የሰው ልጅ እድገት መንገድን ሲይዙ እና ሁለቱንም የምርታማነት ግኝቶችን እና የስህተት ወጪዎችን በጊዜ ሂደት ይከታተላሉ።

ሕገ-መንግሥታዊ AI በተግባር

አንድ ሞዴል ምን ያህል ጠንቃቃ እንደሆነ ለማስተካከል የጽሑፍ መርሆ ማረም፣ ከዚያም በሺዎች የሚቆጠሩ ምሳሌዎችን ሳያስቀምጡ የባህሪ ለውጥን መመልከት።

አንድ ሞዴል ምን ያህል ጠንቃቃ እንደሆነ ለማስተካከል የጽሑፍ መርሆ ማስተካከል፣ ከዚያም የባህሪ ለውጥን መመልከት በሺዎች የሚቆጠሩ ምሳሌዎችን ሳያስቀምጡ ቡድኖች ብዙውን ጊዜ የጥራት ደረጃዎችን ሲገልጹ የተሻለ ውጤት ያገኛሉ፣ ለዳር ጉዳዮች የሰው ልጅ እድገት መንገድን ይጠብቃሉ፣ እና ሁለቱንም የምርታማነት ግኝቶችን እና የስህተት ወጪዎችን በጊዜ ሂደት ይከታተላሉ።

ሕገ-መንግሥታዊ AI በተግባር

የአምሳያው ሕገ መንግሥትን የሚቀርጹ መርሆችን ሕዝቡ የሚያቀርብበት የጋራ ግብዓት ልምምዶችን ማካሄድ።

ህዝባዊው የአምሳያው ህገ መንግስትን የሚቀርጹ መርሆዎችን በሚያቀርብበት የጋራ ግብአት ልምምዶችን ማካሄድ ቡድኖቹ ብዙውን ጊዜ የጥራት ደረጃዎችን ፊት ለፊት ሲገልጹ የተሻለ ውጤት ያገኛሉ፣ ለዳር ጉዳዮች የሰው ልጅ መሻሻል መንገድን ሲይዙ እና ሁለቱንም የምርታማነት ግኝቶችን እና የስህተት ወጪዎችን በጊዜ ሂደት መከታተል።

አደጋዎች እና የጥበቃ መንገዶች

!

የተሳሳቱ እውነታዎች በጸጥታ ወደ ሪፖርቶች፣ የድጋፍ ፍሰቶች ወይም የምርምር ውጤቶችን ማስገባት ይችላሉ።

!

ፈጣን ትብነት በተመሳሳይ ጥያቄዎች ላይ የማይጣጣሙ ውጤቶችን ሊፈጥር ይችላል።

!

የመዳረሻ መቆጣጠሪያዎች ደካማ ከሆኑ ሚስጥራዊነት ያለው የጽሑፍ ውሂብ ሊጋለጥ ይችላል።

የትግበራ ፍኖተ ካርታ

1

ከመልቀቅዎ በፊት የውጤት ቅርጸትን፣ ድምጽን እና የጥራት ደረጃዎችን ይግለጹ።

ከመልቀቅዎ በፊት የውጤት ቅርጸትን፣ ድምጽን እና የጥራት ደረጃዎችን ይግለጹ። እያንዳንዱን እርምጃ እንደማስረጃ በር ያዙት፡ መመዘኛዎቹ ካልተሟሉ፣ መልቀቅን ለአፍታ አቁም፣ ክፍተቱን ይዝጉ እና ከዚያ ብቻ አጠቃቀምን ያስፋፉ።

2

ትክክለኛነት አስፈላጊ በሚሆንበት ጊዜ ሁሉ ከታመኑ ምንጮች ጋር ምላሾች።

ትክክለኛነት አስፈላጊ በሚሆንበት ጊዜ ሁሉ ከታመኑ ምንጮች ጋር ምላሾች። እያንዳንዱን እርምጃ እንደማስረጃ በር ያዙት፡ መመዘኛዎቹ ካልተሟሉ፣ መልቀቅን ለአፍታ አቁም፣ ክፍተቱን ይዝጉ እና ከዚያ ብቻ አጠቃቀምን ያስፋፉ።

3

ከፍተኛ ውጤት ለማግኘት የሰው የግምገማ ነጥብ አቆይ።

ከፍተኛ ውጤት ለማግኘት የሰው የግምገማ ነጥብ አቆይ። እያንዳንዱን እርምጃ እንደማስረጃ በር ያዙት፡ መመዘኛዎቹ ካልተሟሉ፣ መልቀቅን ለአፍታ አቁም፣ ክፍተቱን ይዝጉ እና ከዚያ ብቻ አጠቃቀምን ያስፋፉ።

4

የውድቀት ንድፎችን ይከታተሉ እና ጥያቄዎችን ወይም የስራ ፍሰቶችን በመደበኛነት ያሠለጥኑ።

የውድቀት ንድፎችን ይከታተሉ እና ጥያቄዎችን ወይም የስራ ፍሰቶችን በመደበኛነት ያሠለጥኑ። እያንዳንዱን እርምጃ እንደማስረጃ በር ያዙት፡ መመዘኛዎቹ ካልተሟሉ፣ መልቀቅን ለአፍታ አቁም፣ ክፍተቱን ይዝጉ እና ከዚያ ብቻ አጠቃቀምን ያስፋፉ።

ማሰስዎን ይቀጥሉ