คู่มือบริษัท

การวิจัยใหม่

Nous Research เป็นห้องปฏิบัติการ AI ที่ขับเคลื่อนโดยชุมชน ซึ่งเป็นที่รู้จักในด้านการปรับแต่งโมเดลแบบเปิดยอดนิยมให้เป็นผู้ช่วยที่มีความสามารถสูงและถูกจำกัดน้อยลง และสำหรับการผลักดันการฝึกอบรมแบบกระจายอำนาจ

ภาพรวม

Nous Research เป็นห้องปฏิบัติการ AI ที่ขับเคลื่อนโดยชุมชน ซึ่งเป็นที่รู้จักในด้านการปรับแต่งโมเดลแบบเปิดยอดนิยมให้เป็นผู้ช่วยที่มีความสามารถสูงและถูกจำกัดน้อยลง และสำหรับการผลักดันการฝึกอบรมแบบกระจายอำนาจ มันแสดงให้เห็นว่าทีมขนาดเล็กและชุมชนโอเพ่นซอร์สสามารถแข่งขันกับคุณภาพของโมเดลโดยไม่ต้องเป็นเจ้าของโครงสร้างพื้นฐานขนาดใหญ่ได้อย่างไร

Nous Research เป็นที่เข้าใจดีที่สุดในบริบทของกลยุทธ์ การเข้าถึงโมเดล การตัดสินใจเกี่ยวกับแพลตฟอร์ม และความร่วมมือในระบบนิเวศ

เจาะลึก

Nous Research มีชื่อเสียงมากขึ้นด้วยการใช้แบบจำลองแบบเปิด โดยเฉพาะตระกูล Llama และ Mistral ของ Meta และปรับแต่งให้เป็นซีรีส์ Hermes และ Capybara ที่ใช้กันอย่างแพร่หลาย รุ่น OpenHermes และ Nous Hermes กลายเป็นเพลงที่มียอดดาวน์โหลดมากที่สุดเพลง Hugging Face ซึ่งได้รับการยกย่องจากการทำตามคำแนะนำอย่างเข้มข้น และเน้นที่ความสามารถในการบังคับเลี้ยวมากกว่าพฤติกรรมการปฏิเสธอย่างหนัก นอกเหนือจากการปรับแต่งอย่างละเอียดแล้ว Nous ยังจัดการกับปัญหาหนักๆ นั่นก็คือการฝึกอบรมแบบกระจาย การวิจัย DisTrO ของพวกเขาและเครื่องมือเพิ่มประสิทธิภาพ DeMo มีเป้าหมายเพื่อลดแบนด์วิดท์การสื่อสารที่จำเป็นระหว่าง GPU และเครือข่าย Psyche สำรวจการฝึกอบรมโมเดลขนาดใหญ่ผ่านฮาร์ดแวร์ที่เชื่อมต่ออินเทอร์เน็ตที่กระจัดกระจายทางภูมิศาสตร์ พวกเขายังได้ทดลองใช้โมเดลที่เน้นการใช้เครื่องมือและการให้เหตุผล โดยวางตำแหน่งตัวเองไว้ที่ขอบเขตของ AI แบบเปิดและกระจายอำนาจ

ข้อมูลเชิงลึกทางเทคนิค

โมเดลของ Nous ส่วนใหญ่ไม่ได้รับการฝึกฝนตั้งแต่เริ่มต้น พวกเขาใช้การปรับแต่งอย่างละเอียดภายใต้การดูแลและการเพิ่มประสิทธิภาพการตั้งค่า (เช่น DPO) ที่ด้านบนของตุ้มน้ำหนักฐานแบบเปิดโดยใช้ชุดข้อมูลสังเคราะห์และชุดข้อมูลของมนุษย์ที่ดูแลจัดการอย่างระมัดระวัง งานฝึกอบรมแบบกระจายของพวกเขาโจมตีคอขวดของแบนด์วิธ: โดยปกติแล้ว GPU จะต้องแลกเปลี่ยนการอัปเดตการไล่ระดับขนาดใหญ่ทุกขั้นตอน DisTrO/DeMo บีบอัดและแยกการอัปเดตเหล่านี้ เพื่อให้โหนดสามารถฝึกอบรมร่วมกันผ่านลิงก์อินเทอร์เน็ตทั่วไป แทนที่จะต้องใช้การเชื่อมต่อระหว่างศูนย์ข้อมูลที่มีการเชื่อมโยงกันอย่างแน่นหนา

การเรียนรู้การวิจัย Nous

Nous Research เป็นห้องปฏิบัติการ AI ที่ขับเคลื่อนโดยชุมชน ซึ่งเป็นที่รู้จักในด้านการปรับแต่งโมเดลแบบเปิดยอดนิยมให้เป็นผู้ช่วยที่มีความสามารถสูงและถูกจำกัดน้อยลง และสำหรับการผลักดันการฝึกอบรมแบบกระจายอำนาจ มันแสดงให้เห็นว่าทีมขนาดเล็กและชุมชนโอเพ่นซอร์สสามารถแข่งขันกับคุณภาพของโมเดลโดยไม่ต้องเป็นเจ้าของโครงสร้างพื้นฐานขนาดใหญ่ได้อย่างไร Nous Research เป็นที่เข้าใจดีที่สุดในบริบทของกลยุทธ์ การเข้าถึงโมเดล การตัดสินใจเกี่ยวกับแพลตฟอร์ม และความร่วมมือในระบบนิเวศ เพื่อสร้างความเข้าใจอย่างลึกซึ้ง ให้ถือว่า Nous Research เป็นแบบจำลองการดำเนินงาน ไม่ใช่คุณลักษณะเดียว: กำหนดผลลัพธ์ที่ต้องการ ชี้แจงสมมติฐาน และแยกสิ่งที่ระบบสามารถทำได้อย่างน่าเชื่อถือจากสิ่งที่ยังต้องใช้วิจารณญาณจากผู้เชี่ยวชาญ

ในทางปฏิบัติ ทีมที่แข็งแกร่งที่ใช้ Nous Research จะประเมินกลยุทธ์ของผู้จำหน่าย ความน่าเชื่อถือของแผนงาน และความเสี่ยงในการล็อคอินก่อนตัดสินใจ โดยจะบันทึกเกณฑ์ความสำเร็จที่ชัดเจน ทดสอบกับข้อมูลและขั้นตอนการทำงานที่สมจริง และทำซ้ำตามรูปแบบความล้มเหลวที่สังเกตได้ แทนที่จะชนะการวัดประสิทธิภาพเพียงครั้งเดียว นี่คือจุดที่ความเข้าใจทางทฤษฎีกลายเป็นความสามารถที่คงทนของผลิตภัณฑ์ นโยบาย และการดำเนินงาน

โรดแมปของผู้จำหน่ายมีอิทธิพลต่อฟีเจอร์ที่ทีมของคุณสามารถสร้างได้ต่อไป ในขณะเดียวกัน การประกาศเปิดตัวอาจแซงหน้าความเสถียรในขั้นตอนการทำงานจริง แนวทางที่ยืดหยุ่นที่สุดคือการรวมความเร็วของการทดลองเข้ากับวินัยในการกำกับดูแล: ดำเนินการนำร่อง จับหลักฐาน เผยแพร่บันทึกการตัดสินใจ และอัปเดตการป้องกันอย่างต่อเนื่องเมื่อพฤติกรรมของโมเดล ความคาดหวังของผู้ใช้ และข้อกำหนดด้านกฎระเบียบมีการเปลี่ยนแปลง

ผลกระทบเชิงกลยุทธ์

โรดแมปของผู้จำหน่ายมีอิทธิพลต่อฟีเจอร์ที่ทีมของคุณสามารถสร้างได้ต่อไป

โรดแมปของผู้จำหน่ายมีอิทธิพลต่อฟีเจอร์ที่ทีมของคุณสามารถสร้างได้ต่อไป ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

ข้อกำหนดทางการค้าและตัวเลือกการใช้งานส่งผลต่อต้นทุนและความเสี่ยงในระยะยาว

ข้อกำหนดทางการค้าและตัวเลือกการใช้งานส่งผลต่อต้นทุนและความเสี่ยงในระยะยาว ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

สิ่งจูงใจของบริษัทจะกำหนดค่าเริ่มต้นของผลิตภัณฑ์ ท่าทางที่ปลอดภัย และความเปิดกว้าง

สิ่งจูงใจของบริษัทจะกำหนดค่าเริ่มต้นของผลิตภัณฑ์ ท่าทางที่ปลอดภัย และความเปิดกว้าง ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

อนาคตของการวิจัย Nous

Nous กำลังเดิมพันว่าอนาคตของ AI แบบเปิดจะมีการกระจายอำนาจ โดยที่การประมวลผลถูกรวบรวมจากผู้มีส่วนร่วมอิสระจำนวนมาก แทนที่จะกระจุกตัวอยู่ในคลัสเตอร์ไฮเปอร์สเกลเพียงไม่กี่คลัสเตอร์ หากวิธีการฝึกอบรมที่มีแบนด์วิธต่ำขยายวงกว้าง ชุมชนก็สามารถฝึกอบรมโมเดลระดับแนวหน้าร่วมกันได้ คาดว่าจะมีการเปิดตัวผู้ช่วยแบบเปิดที่มีความสามารถอย่างต่อเนื่อง การลงทุนเชิงลึกในเครือข่ายแบบกระจาย Psyche และโมเดลที่เน้นการใช้เหตุผล งานของพวกเขาสามารถลดอุปสรรคในการฝึกโมเดลขนาดใหญ่ที่อยู่นอกเทคโนโลยีขนาดใหญ่ได้อย่างมีนัยสำคัญ

การใช้งานจริงในโลกแห่งความเป็นจริง

นักพัฒนาใช้งานโมเดล Nous Hermes และ OpenHermes ภายในเครื่องสำหรับผู้ช่วยแชทส่วนตัวที่ควบคุมทิศทางได้ โดยไม่มีค่าใช้จ่าย API

นักวิจัยอ้างถึงวิธี DisTrO และ DeMo ของ Nous เมื่อสำรวจการฝึกโมเดลแบบกระจายที่มีประสิทธิภาพแบนด์วิธ

ผู้ที่เป็นงานอดิเรกและบริษัทขนาดเล็กปรับแต่งชุดข้อมูลที่ปล่อยออกมาของ Nous เพื่อสร้างผู้ช่วยเฉพาะโดเมน

เครือข่าย Psyche ใช้เพื่อทดลองโมเดลการฝึกอบรมกับ GPU อาสาสมัครที่กระจายตามพื้นที่ทางภูมิศาสตร์

รูปแบบการดำเนินงาน

การวิจัยเชิงปฏิบัติ

นักพัฒนาใช้งานโมเดล Nous Hermes และ OpenHermes ภายในเครื่องสำหรับผู้ช่วยแชทส่วนตัวที่ควบคุมทิศทางได้ โดยไม่มีค่าใช้จ่าย API

นักพัฒนาใช้งานโมเดล Nous Hermes และ OpenHermes ภายในเครื่องสำหรับผู้ช่วยแชทส่วนตัวที่บังคับทิศทางได้ โดยไม่มีค่าใช้จ่าย API ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อกำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการทำงานที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

การวิจัยเชิงปฏิบัติ

นักวิจัยอ้างถึงวิธี DisTrO และ DeMo ของ Nous เมื่อสำรวจการฝึกโมเดลแบบกระจายที่มีประสิทธิภาพแบนด์วิธ

นักวิจัยอ้างถึงวิธี DisTrO และ DeMo ของ Nous เมื่อสำรวจการฝึกอบรมโมเดลแบบกระจายที่มีประสิทธิภาพแบนด์วิดท์ ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งการเพิ่มผลผลิตและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

การวิจัยเชิงปฏิบัติ

ผู้ที่เป็นงานอดิเรกและบริษัทขนาดเล็กปรับแต่งชุดข้อมูลที่ปล่อยออกมาของ Nous เพื่อสร้างผู้ช่วยเฉพาะโดเมน

นักงานอดิเรกและบริษัทขนาดเล็กปรับแต่งชุดข้อมูลที่ปล่อยออกมาของ Nous เพื่อสร้างผู้ช่วยเฉพาะโดเมน ทีมมักจะได้รับผลลัพธ์ที่ดีขึ้นเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการทำงานที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

การวิจัยเชิงปฏิบัติ

เครือข่าย Psyche ใช้เพื่อทดลองโมเดลการฝึกอบรมกับ GPU อาสาสมัครที่กระจายตามพื้นที่ทางภูมิศาสตร์

เครือข่าย Psyche ใช้เพื่อทดลองกับโมเดลการฝึกอบรมทั่วทั้ง GPU อาสาสมัครที่กระจายตามพื้นที่ต่างๆ ทีมมักจะได้รับผลลัพธ์ที่ดีขึ้นเมื่อกำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการทำงานที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

ความเสี่ยงและรั้ว

!

การประกาศเปิดตัวอาจแซงหน้าความเสถียรในขั้นตอนการทำงานจริง

!

การกำหนดราคา API หรือการเปลี่ยนแปลงนโยบายสามารถทำลายสมมติฐานได้ในชั่วข้ามคืน

!

การพึ่งพาผู้ขายรายเดียวจะเพิ่มค่าใช้จ่ายในการล็อคอินและการย้ายข้อมูล

แผนงานการดำเนินงาน

1

ประเมินผู้ให้บริการโดยใช้งานและชุดข้อมูลของคุณเอง

ประเมินผู้ให้บริการโดยใช้งานและชุดข้อมูลของคุณเอง ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

2

ตรวจสอบความเป็นส่วนตัว ความปลอดภัย และข้อกำหนดทางกฎหมายก่อนรวมระบบ

ตรวจสอบความเป็นส่วนตัว ความปลอดภัย และข้อกำหนดทางกฎหมายก่อนรวมระบบ ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

3

รักษาแผนสำรองสำหรับรุ่นหรือผู้จำหน่าย

รักษาแผนสำรองสำหรับรุ่นหรือผู้จำหน่าย ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

4

ตรวจสอบบันทึกประจำรุ่นเพื่อให้การเปลี่ยนแปลงแผนงานไม่ทำให้ทีมแปลกใจ

ตรวจสอบบันทึกประจำรุ่นเพื่อให้การเปลี่ยนแปลงแผนงานไม่ทำให้ทีมแปลกใจ ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

สำรวจต่อไป