คู่มือทางเทคนิค

การใช้เหตุผลกราฟของความคิด

โมเดลกราฟของความคิดที่ใช้เหตุผลเป็นเครือข่ายที่ความคิดสามารถผสาน วนซ้ำ และเชื่อมต่อได้อย่างอิสระ ไม่ใช่แค่แยกสาขา

ภาพรวม

โมเดลกราฟของความคิดที่ใช้เหตุผลเป็นเครือข่ายที่ความคิดสามารถผสาน วนซ้ำ และเชื่อมต่อได้อย่างอิสระ ไม่ใช่แค่แยกสาขา ซึ่งช่วยให้โมเดลสามารถรวมข้อมูลเชิงลึกจากเส้นทางที่แตกต่างกันและปรับแต่งได้ นอกเหนือไปจากโครงสร้างรูปต้นไม้ของ Tree-of-Thoughts อย่างเคร่งครัด

การใช้เหตุผลแบบกราฟแห่งความคิดเป็นองค์ประกอบทางเทคนิคที่ส่งผลต่อคุณภาพของโมเดล ต้นทุนโครงสร้างพื้นฐาน เวลาแฝง และความน่าเชื่อถือในวงกว้าง

เจาะลึก

เสนอโดย Besta และคณะ ในปี 2023 Graph-of-Thoughts (GoT) แสดงถึงกระบวนการให้เหตุผลในรูปแบบกราฟที่กำหนดเอง โดยโหนดคือความคิด (คำตอบบางส่วน) และขอบเป็นการพึ่งพาระหว่างสิ่งเหล่านั้น กราฟต่างจากต้นไม้ที่ความคิดแต่ละอย่างมีพาเรนต์เพียงตัวเดียว กราฟอนุญาตให้ดำเนินการที่ต้นไม้ไม่สามารถทำได้ ได้แก่ การรวมกลุ่มที่ความคิดหลายรายการรวมเป็นโซลูชันเดียว และการปรับแต่ง ซึ่งความคิดวนซ้ำเพื่อปรับปรุงตัวมันเอง สิ่งนี้มีประสิทธิภาพมากสำหรับปัญหาที่แยกย่อยเป็นปัญหาย่อยที่ต้องรวมคำตอบเข้าด้วยกัน สำหรับการเรียงลำดับและกำหนดงาน GoT สามารถแยกรายการ แก้ชิ้นส่วนแยกกัน และรวมส่วนที่จัดเรียงไว้ได้ ผู้เขียนรายงานว่า GoT ปรับปรุงคุณภาพการเรียงลำดับมากกว่า Tree-of-Thoughts ในขณะที่ลดต้นทุน เนื่องจากการผสานทำให้ใช้ผลลัพธ์ระดับกลางได้ดีขึ้น ตัวควบคุม กำหนดการ 'กราฟการดำเนินงาน' และโมดูลการให้คะแนน/การจัดอันดับจะประสานการทำงานของการเปลี่ยนแปลง

ข้อมูลเชิงลึกทางเทคนิค

นามธรรมที่สำคัญของ GoT คือการปฏิบัติต่อความคิดเป็นกราฟและขั้นตอนการให้เหตุผลเป็นการแปลงกราฟ: การสร้างจะเพิ่มโหนดความคิดใหม่ การรวมรวมหลายโหนดเป็นหนึ่งเดียว (โดยมีขอบที่เข้ามาจากแต่ละแหล่ง) และการปรับแต่งจะสร้างการวนซ้ำในตัวเองที่แก้ไขความคิด ฟังก์ชันการให้คะแนนและการจัดอันดับจะเลือกความคิดที่ดีที่สุดที่จะเก็บไว้ ในขณะที่ตัวควบคุมจะดำเนินการตามกราฟการดำเนินการที่กำหนดไว้ล่วงหน้า ความสามารถในการผสานนี้เป็นสิ่งที่ต้นไม้แม่-ลูกที่เข้มงวดไม่สามารถแสดงออกได้ และเป็นสิ่งที่ทำให้สามารถรวมและรวมโซลูชันบางส่วนเข้าด้วยกันใหม่ได้

การเรียนรู้การใช้เหตุผลแบบกราฟแห่งความคิด

โมเดลกราฟของความคิดที่ใช้เหตุผลเป็นเครือข่ายที่ความคิดสามารถผสาน วนซ้ำ และเชื่อมต่อได้อย่างอิสระ ไม่ใช่แค่แยกสาขา ซึ่งช่วยให้โมเดลสามารถรวมข้อมูลเชิงลึกจากเส้นทางที่แตกต่างกันและปรับแต่งได้ นอกเหนือไปจากโครงสร้างรูปต้นไม้ของ Tree-of-Thoughts อย่างเคร่งครัด การใช้เหตุผลแบบกราฟแห่งความคิดเป็นองค์ประกอบทางเทคนิคที่ส่งผลต่อคุณภาพของโมเดล ต้นทุนโครงสร้างพื้นฐาน เวลาแฝง และความน่าเชื่อถือในวงกว้าง เพื่อสร้างความเข้าใจอย่างลึกซึ้ง ให้ถือว่าการใช้เหตุผลแบบกราฟแห่งความคิดเป็นรูปแบบการดำเนินงาน ไม่ใช่คุณลักษณะเดียว: กำหนดผลลัพธ์ที่ต้องการ ชี้แจงสมมติฐาน และแยกสิ่งที่ระบบสามารถทำได้อย่างน่าเชื่อถือจากสิ่งที่ยังต้องใช้วิจารณญาณจากผู้เชี่ยวชาญ

ในทางปฏิบัติ ทีมที่แข็งแกร่งที่ใช้การใช้เหตุผลแบบกราฟแห่งความคิดจะปรับสถาปัตยกรรม ข้อมูล และตัวเลือกโครงสร้างพื้นฐานให้เหมาะสมโดยเทียบกับความน่าเชื่อถือและต้นทุน โดยจะบันทึกเกณฑ์ความสำเร็จที่ชัดเจน ทดสอบกับข้อมูลและขั้นตอนการทำงานที่สมจริง และทำซ้ำตามรูปแบบความล้มเหลวที่สังเกตได้ แทนที่จะชนะการวัดประสิทธิภาพเพียงครั้งเดียว นี่คือจุดที่ความเข้าใจทางทฤษฎีกลายเป็นความสามารถที่คงทนของผลิตภัณฑ์ นโยบาย และการดำเนินงาน

การตัดสินใจด้านสถาปัตยกรรมขับเคลื่อนประสิทธิภาพและต้นทุนการดำเนินงานเป็นเวลาหลายปี ในเวลาเดียวกัน การเพิ่มประสิทธิภาพเกณฑ์มาตรฐานหนึ่งรายการสามารถซ่อนจุดอ่อนของระบบในวงกว้างได้ แนวทางที่ยืดหยุ่นที่สุดคือการรวมความเร็วของการทดลองเข้ากับวินัยในการกำกับดูแล: ดำเนินการนำร่อง จับหลักฐาน เผยแพร่บันทึกการตัดสินใจ และอัปเดตการป้องกันอย่างต่อเนื่องเมื่อพฤติกรรมของโมเดล ความคาดหวังของผู้ใช้ และข้อกำหนดด้านกฎระเบียบมีการเปลี่ยนแปลง

ผลกระทบเชิงกลยุทธ์

การตัดสินใจด้านสถาปัตยกรรมขับเคลื่อนประสิทธิภาพและต้นทุนการดำเนินงานเป็นเวลาหลายปี

การตัดสินใจด้านสถาปัตยกรรมขับเคลื่อนประสิทธิภาพและต้นทุนการดำเนินงานเป็นเวลาหลายปี ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

การศึกษาด้านเทคนิคช่วยให้ทีมเลือกกลุ่มที่เหมาะสม ไม่ใช่แค่กลุ่มใหม่ล่าสุด

การศึกษาด้านเทคนิคช่วยให้ทีมเลือกกลุ่มที่เหมาะสม ไม่ใช่แค่กลุ่มใหม่ล่าสุด ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

ตัวเลือกทางวิศวกรรมที่ดีกว่าจะช่วยลดเหตุการณ์ด้านความน่าเชื่อถือในการผลิต

ตัวเลือกทางวิศวกรรมที่ดีกว่าจะช่วยลดเหตุการณ์ด้านความน่าเชื่อถือในการผลิต ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

อนาคตของการให้เหตุผลกราฟของความคิด

กราฟของความคิดชี้ไปที่ระบบการให้เหตุผลซึ่งสร้างและรวมผลลัพธ์ระดับกลางได้อย่างยืดหยุ่น แทนที่จะแยกย่อยเพียงอย่างเดียว คำแนะนำที่เป็นไปได้ ได้แก่ การค้นหาโครงสร้างกราฟที่เหมาะสมสำหรับปัญหาโดยอัตโนมัติ แทนที่จะต้องออกแบบตารางการปฏิบัติงานด้วยมือ การเรียนรู้เมื่อการรวมกลุ่มได้ผลดี และการบูรณาการการใช้เหตุผลเชิงกราฟกับการดึงข้อมูล เครื่องมือ และหน่วยความจำภายนอก เมื่อการให้เหตุผลตามเวลาอนุมานเติบโตขึ้น คาดหวังกรอบการทำงานที่ผสมผสานการค้นหาแบบต้นไม้ การรวมกราฟ และการสะท้อนกลับภายใต้ตัวควบคุมเดียวที่ปรับโครงสร้างให้เข้ากับงาน

การใช้งานจริงในโลกแห่งความเป็นจริง

เรียงลำดับรายการยาวโดยแยกออกเป็นชิ้นๆ จัดเรียงแต่ละชิ้นแยกกัน จากนั้นจึงรวมชิ้นส่วนที่จัดเรียงออกเป็นผลลัพธ์ที่เรียงลำดับเดียว

การสรุปเอกสารที่มีการสร้างบทสรุปบางส่วนของส่วนต่างๆ แล้วรวมเข้าเป็นเนื้อหาทั้งหมดที่สอดคล้องกัน

ตั้งค่าการดำเนินการ เช่น การนับคำหลักหรือการแยก โดยที่ผลลัพธ์ย่อยจะรวมกันผ่านโหนดการรวม

ปรับปรุงโซลูชันที่สร้างขึ้นซ้ำๆ โดยการวนความคิดย้อนกลับไปผ่านขั้นตอนการปรับแต่งจนกว่าคะแนนคุณภาพจะหยุดปรับปรุง

รูปแบบการดำเนินงาน

กราฟความคิด การใช้เหตุผลในทางปฏิบัติ

เรียงลำดับรายการยาวโดยแยกออกเป็นชิ้นๆ จัดเรียงแต่ละชิ้นแยกกัน จากนั้นจึงรวมชิ้นส่วนที่จัดเรียงออกเป็นผลลัพธ์ที่เรียงลำดับเดียว

การเรียงลำดับรายการแบบยาวโดยแบ่งออกเป็นส่วนๆ เรียงลำดับแต่ละส่วนแยกจากกัน จากนั้นรวมส่วนที่เรียงลำดับออกเป็นผลลัพธ์เดียว ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการทำงานที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

กราฟความคิด การใช้เหตุผลในทางปฏิบัติ

การสรุปเอกสารที่มีการสร้างบทสรุปบางส่วนของส่วนต่างๆ แล้วรวมเข้าเป็นเนื้อหาทั้งหมดที่สอดคล้องกัน

การสรุปเอกสารที่มีการสรุปบางส่วนของส่วนต่างๆ ถูกสร้างขึ้นแล้วรวมเข้าเป็นทั้งทีมที่สอดคล้องกัน มักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการทำงานที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

กราฟความคิด การใช้เหตุผลในทางปฏิบัติ

ตั้งค่าการดำเนินการ เช่น การนับคำหลักหรือการแยก โดยที่ผลลัพธ์ย่อยจะรวมกันผ่านโหนดการรวม

ตั้งค่าการดำเนินการ เช่น การนับคำหลักหรือการแยกส่วน โดยที่ผลลัพธ์ย่อยจะถูกรวมเข้าด้วยกันผ่านโหนดการรวม ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อกำหนดเกณฑ์คุณภาพไว้ล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งการเพิ่มผลผลิตและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

กราฟความคิด การใช้เหตุผลในทางปฏิบัติ

ปรับปรุงโซลูชันที่สร้างขึ้นซ้ำๆ โดยการวนความคิดย้อนกลับไปผ่านขั้นตอนการปรับแต่งจนกว่าคะแนนคุณภาพจะหยุดปรับปรุง

ปรับแต่งโซลูชันที่สร้างขึ้นซ้ำๆ โดยการวนความคิดย้อนกลับไปผ่านขั้นตอนการปรับแต่งจนกว่าคะแนนคุณภาพจะหยุดการปรับปรุง โดยปกติแล้วทีมจะได้รับผลลัพธ์ที่ดีขึ้นเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการทำงานที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

ความเสี่ยงและรั้ว

!

การเพิ่มประสิทธิภาพเกณฑ์มาตรฐานหนึ่งรายการสามารถซ่อนจุดอ่อนของระบบในวงกว้างได้

!

ต้นทุนโครงสร้างพื้นฐานและการบำรุงรักษามักถูกประเมินต่ำไป

!

ช่องว่างด้านความปลอดภัยและความสามารถในการสังเกตสามารถเพิ่มขึ้นได้เมื่อระบบมีความซับซ้อนมากขึ้น

แผนงานการดำเนินงาน

1

กำหนดเป้าหมายเวลาแฝง คุณภาพ และต้นทุนก่อนนำไปใช้งาน

กำหนดเป้าหมายเวลาแฝง คุณภาพ และต้นทุนก่อนนำไปใช้งาน ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

2

เกณฑ์มาตรฐานภายใต้สภาวะโหลดและข้อมูลจริง

เกณฑ์มาตรฐานภายใต้สภาวะโหลดและข้อมูลจริง ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

3

การตรวจสอบเครื่องมือเพื่อหาข้อผิดพลาด การเบี่ยงเบน และผลกระทบต่อผู้ใช้

การตรวจสอบเครื่องมือเพื่อหาข้อผิดพลาด การเบี่ยงเบน และผลกระทบต่อผู้ใช้ ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

4

เตรียมเส้นทางการย้อนกลับและการตอบสนองต่อเหตุการณ์ก่อนปรับขนาด

เตรียมเส้นทางการย้อนกลับและการตอบสนองต่อเหตุการณ์ก่อนปรับขนาด ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

สำรวจต่อไป