คู่มือทางเทคนิค

การใช้เหตุผลแบบต้นไม้แห่งความคิด

ต้นไม้แห่งความคิดช่วยให้แบบจำลองสำรวจเส้นทางการใช้เหตุผลหลายเส้นทางไปพร้อมๆ กัน เช่น กิ่งก้านของต้นไม้ แทนที่จะมุ่งมั่นกับแนวความคิดเส้นเดียว

ภาพรวม

ต้นไม้แห่งความคิดช่วยให้แบบจำลองสำรวจเส้นทางการใช้เหตุผลหลายเส้นทางไปพร้อมๆ กัน เช่น กิ่งก้านของต้นไม้ แทนที่จะมุ่งมั่นกับแนวความคิดเส้นเดียว สามารถมองไปข้างหน้า ประเมินวิธีแก้ปัญหาบางส่วน และย้อนรอยจากทางตันได้

การใช้เหตุผลแบบต้นไม้แห่งความคิดเป็นองค์ประกอบทางเทคนิคที่ส่งผลต่อคุณภาพของโมเดล ต้นทุนโครงสร้างพื้นฐาน เวลาแฝง และความน่าเชื่อถือในวงกว้าง

เจาะลึก

แนะนำโดยเหยาและคณะ ในปี 2023 Tree-of-Thoughts (ToT) จะสรุปการกระตุ้นแบบลูกโซ่แห่งความคิด เมื่อห่วงโซ่แห่งความคิดสร้างลำดับเชิงเส้นตรงของขั้นตอนการให้เหตุผล ToT จะจัดโครงสร้างปัญหาเป็นแผนผัง: แต่ละโหนดเป็นวิธีแก้ปัญหาบางส่วน ("ความคิด") และแบบจำลองจะสร้างความคิดถัดไปที่เป็นตัวเลือกหลายรายการจากแต่ละโหนด ขั้นตอนการประเมินที่แยกออกมาจะให้คะแนนว่าแต่ละสาขามีแนวโน้มที่ดีเพียงใด และอัลกอริธึมการค้นหา เช่น การค้นหาแบบกว้างก่อนหรือลึกก่อนจะตัดสินใจว่าจะขยายสาขาใดและควรตัดสาขาใด ซึ่งช่วยให้โมเดลจงใจสำรวจ มองไปข้างหน้า 2-3 ก้าว และย้อนรอยเมื่อเส้นทางดูไม่มีแนวโน้มดี ToT ฉายแววภารกิจที่เอาชนะการใช้เหตุผลแบบเส้นทางเดียวอันละโมบ โดยที่โด่งดังที่สุดคือเกม 24 โดยที่ GPT-4 ที่มีห่วงโซ่แห่งความคิดสามารถไขปริศนาได้ประมาณ 4% แต่ ToT ผลักดันความสำเร็จเป็นประมาณ 74%

ข้อมูลเชิงลึกทางเทคนิค

ToT มีสามส่วน: เครื่องกำเนิดความคิดที่เสนอขั้นตอนต่อไปของผู้สมัคร ผู้ประเมินของรัฐ (มักจะเป็น LLM เดียวกันที่ได้รับแจ้งให้ให้คะแนนหรือลงคะแนนในวิธีแก้ปัญหาบางส่วนว่า 'แน่นอน / อาจจะ / เป็นไปไม่ได้') และขั้นตอนการค้นหา (BFS, DFS หรือการค้นหาแบบลำแสง) ที่นำทางแผนผัง เนื่องจากโมเดลประเมินสถานะบางส่วนและตัดกิ่งที่อ่อนแอ โมเดลจึงจัดสรรการประมวลผลไปยังขอบเขตที่เป็นไปได้ของพื้นที่โซลูชัน การแลกเปลี่ยนการอนุมานเพิ่มเติมจำเป็นต้องมีความแม่นยำที่สูงขึ้นอย่างมากในปัญหาที่ยาก

การเรียนรู้การใช้เหตุผลแบบต้นไม้แห่งความคิด

ต้นไม้แห่งความคิดช่วยให้แบบจำลองสำรวจเส้นทางการใช้เหตุผลหลายเส้นทางไปพร้อมๆ กัน เช่น กิ่งก้านของต้นไม้ แทนที่จะมุ่งมั่นกับแนวความคิดเส้นเดียว สามารถมองไปข้างหน้า ประเมินวิธีแก้ปัญหาบางส่วน และย้อนรอยจากทางตันได้ การใช้เหตุผลแบบต้นไม้แห่งความคิดเป็นองค์ประกอบทางเทคนิคที่ส่งผลต่อคุณภาพของโมเดล ต้นทุนโครงสร้างพื้นฐาน เวลาแฝง และความน่าเชื่อถือในวงกว้าง เพื่อสร้างความเข้าใจอย่างลึกซึ้ง ให้ถือว่าการใช้เหตุผลแบบต้นไม้แห่งความคิดเป็นรูปแบบการดำเนินงาน ไม่ใช่คุณลักษณะเดียว: กำหนดผลลัพธ์ที่ต้องการ ชี้แจงสมมติฐาน และแยกสิ่งที่ระบบสามารถทำได้อย่างน่าเชื่อถือจากสิ่งที่ยังต้องใช้วิจารณญาณจากผู้เชี่ยวชาญ

ในทางปฏิบัติ ทีมที่แข็งแกร่งที่ใช้เหตุผลแบบต้นไม้แห่งความคิดจะปรับสถาปัตยกรรม ข้อมูล และตัวเลือกโครงสร้างพื้นฐานให้เหมาะสมโดยเทียบกับความน่าเชื่อถือและต้นทุน โดยจะบันทึกเกณฑ์ความสำเร็จที่ชัดเจน ทดสอบกับข้อมูลและขั้นตอนการทำงานที่สมจริง และทำซ้ำตามรูปแบบความล้มเหลวที่สังเกตได้ แทนที่จะชนะการวัดประสิทธิภาพเพียงครั้งเดียว นี่คือจุดที่ความเข้าใจทางทฤษฎีกลายเป็นความสามารถที่คงทนของผลิตภัณฑ์ นโยบาย และการดำเนินงาน

การตัดสินใจด้านสถาปัตยกรรมขับเคลื่อนประสิทธิภาพและต้นทุนการดำเนินงานเป็นเวลาหลายปี ในเวลาเดียวกัน การเพิ่มประสิทธิภาพเกณฑ์มาตรฐานหนึ่งรายการสามารถซ่อนจุดอ่อนของระบบในวงกว้างได้ แนวทางที่ยืดหยุ่นที่สุดคือการรวมความเร็วของการทดลองเข้ากับวินัยในการกำกับดูแล: ดำเนินการนำร่อง จับหลักฐาน เผยแพร่บันทึกการตัดสินใจ และอัปเดตการป้องกันอย่างต่อเนื่องเมื่อพฤติกรรมของโมเดล ความคาดหวังของผู้ใช้ และข้อกำหนดด้านกฎระเบียบมีการเปลี่ยนแปลง

ผลกระทบเชิงกลยุทธ์

การตัดสินใจด้านสถาปัตยกรรมขับเคลื่อนประสิทธิภาพและต้นทุนการดำเนินงานเป็นเวลาหลายปี

การตัดสินใจด้านสถาปัตยกรรมขับเคลื่อนประสิทธิภาพและต้นทุนการดำเนินงานเป็นเวลาหลายปี ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

การศึกษาด้านเทคนิคช่วยให้ทีมเลือกกลุ่มที่เหมาะสม ไม่ใช่แค่กลุ่มใหม่ล่าสุด

การศึกษาด้านเทคนิคช่วยให้ทีมเลือกกลุ่มที่เหมาะสม ไม่ใช่แค่กลุ่มใหม่ล่าสุด ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

ตัวเลือกทางวิศวกรรมที่ดีกว่าจะช่วยลดเหตุการณ์ด้านความน่าเชื่อถือในการผลิต

ตัวเลือกทางวิศวกรรมที่ดีกว่าจะช่วยลดเหตุการณ์ด้านความน่าเชื่อถือในการผลิต ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

อนาคตของการให้เหตุผลแบบต้นไม้แห่งความคิด

แนวคิดแบบต้นไม้มีอิทธิพลต่อวิธีการใช้เวลาในการอนุมาน: แทนที่จะส่งผ่านครั้งใหญ่เพียงครั้งเดียว ระบบจะค้นหาเส้นทางการใช้เหตุผลและเลือกสิ่งที่ดีที่สุดมากขึ้นเรื่อยๆ งานในอนาคตมีจุดมุ่งหมายเพื่อเรียนรู้ว่าเมื่อใดที่การแยกสาขามีค่าใช้จ่ายโทเค็นสูง เพื่อใช้ฟังก์ชันค่าที่ได้รับการฝึกอบรมแทนการประเมินตนเองโดยทันที และพับการค้นหาแบบต้นไม้เป็นรูปแบบการให้เหตุผลเพื่อให้การพิจารณามีประสิทธิภาพมากขึ้น คาดหวังการผสานรวมกับเครื่องมือและผู้ตรวจสอบที่เข้มงวดมากขึ้น ดังนั้นการประเมินสาขาจะขึ้นอยู่กับผลตอบรับจริงมากกว่าการคาดเดาของแบบจำลอง

การใช้งานจริงในโลกแห่งความเป็นจริง

แก้เกม 24 โดยการแยกตัวเลขสองตัวมารวมกันก่อน และตัดเส้นทางเลขคณิตที่ไม่สามารถเข้าถึง 24 ได้

การเขียนเชิงสร้างสรรค์ที่มีแผนที่สอดคล้องกัน โดยที่แบบจำลองจะร่างโครงร่างโครงเรื่องต่างๆ ประเมิน และขยายส่วนที่แข็งแกร่งที่สุดก่อนที่จะเขียนร้อยแก้ว

ปริศนาที่มีข้อจำกัด เช่น ปริศนาอักษรไขว้ขนาดเล็ก โดยแต่ละคำที่เติมไว้เป็นเพียงความคิด และกิ่งก้านที่เข้ากันไม่ได้จะถูกละทิ้ง

ปัญหาทางคณิตศาสตร์หรือการวางแผนแบบหลายขั้นตอนที่แบบจำลองสำรวจขั้นตอนกลางทางเลือกและการย้อนรอยจากขั้นตอนที่ฝ่าฝืนข้อจำกัด

รูปแบบการดำเนินงาน

การใช้เหตุผลแบบต้นไม้แห่งความคิดในทางปฏิบัติ

แก้เกม 24 โดยการแยกตัวเลขสองตัวมารวมกันก่อน และตัดเส้นทางเลขคณิตที่ไม่สามารถเข้าถึง 24 ได้

การแก้เกม 24 โดยการแยกตัวเลขสองตัวมารวมกันก่อน และการตัดเส้นทางเลขคณิตที่ไม่สามารถเข้าถึง 24 ทีมมักจะได้ผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการทำงานที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

การใช้เหตุผลแบบต้นไม้แห่งความคิดในทางปฏิบัติ

การเขียนเชิงสร้างสรรค์ที่มีแผนที่สอดคล้องกัน โดยที่แบบจำลองจะร่างโครงร่างโครงเรื่องต่างๆ ประเมิน และขยายส่วนที่แข็งแกร่งที่สุดก่อนที่จะเขียนร้อยแก้ว

การเขียนเชิงสร้างสรรค์ด้วยแผนที่สอดคล้องกัน โดยที่แบบจำลองจะร่างเค้าโครงโครงเรื่องหลายเรื่อง ประเมิน และขยายส่วนที่แข็งแกร่งที่สุดก่อนที่จะเขียนร้อยแก้ว ทีมมักจะได้ผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับของมนุษย์สำหรับกรณีขอบ และติดตามทั้งการเพิ่มผลผลิตและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

การใช้เหตุผลแบบต้นไม้แห่งความคิดในทางปฏิบัติ

ปริศนาที่มีข้อจำกัด เช่น ปริศนาอักษรไขว้ขนาดเล็ก โดยแต่ละคำที่เติมไว้เป็นเพียงความคิด และกิ่งก้านที่เข้ากันไม่ได้จะถูกละทิ้ง

ปริศนาที่มีข้อจำกัด เช่น ปริศนาอักษรไขว้ขนาดเล็ก ซึ่งคำแต่ละคำเป็นเพียงความคิด และสาขาที่เข้ากันไม่ได้จะถูกละทิ้ง ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการทำงานที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

การใช้เหตุผลแบบต้นไม้แห่งความคิดในทางปฏิบัติ

ปัญหาทางคณิตศาสตร์หรือการวางแผนแบบหลายขั้นตอนที่แบบจำลองสำรวจขั้นตอนกลางทางเลือกและการย้อนรอยจากขั้นตอนที่ฝ่าฝืนข้อจำกัด

ปัญหาทางคณิตศาสตร์หรือการวางแผนแบบหลายขั้นตอนที่แบบจำลองสำรวจขั้นตอนกลางทางเลือกและการย้อนรอยจากขั้นตอนที่ฝ่าฝืนข้อจำกัด ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการทำงานที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

ความเสี่ยงและรั้ว

!

การเพิ่มประสิทธิภาพเกณฑ์มาตรฐานหนึ่งรายการสามารถซ่อนจุดอ่อนของระบบในวงกว้างได้

!

ต้นทุนโครงสร้างพื้นฐานและการบำรุงรักษามักถูกประเมินต่ำไป

!

ช่องว่างด้านความปลอดภัยและความสามารถในการสังเกตสามารถเพิ่มขึ้นได้เมื่อระบบมีความซับซ้อนมากขึ้น

แผนงานการดำเนินงาน

1

กำหนดเป้าหมายเวลาแฝง คุณภาพ และต้นทุนก่อนนำไปใช้งาน

กำหนดเป้าหมายเวลาแฝง คุณภาพ และต้นทุนก่อนนำไปใช้งาน ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

2

เกณฑ์มาตรฐานภายใต้สภาวะโหลดและข้อมูลจริง

เกณฑ์มาตรฐานภายใต้สภาวะโหลดและข้อมูลจริง ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

3

การตรวจสอบเครื่องมือเพื่อหาข้อผิดพลาด การเบี่ยงเบน และผลกระทบต่อผู้ใช้

การตรวจสอบเครื่องมือเพื่อหาข้อผิดพลาด การเบี่ยงเบน และผลกระทบต่อผู้ใช้ ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

4

เตรียมเส้นทางการย้อนกลับและการตอบสนองต่อเหตุการณ์ก่อนปรับขนาด

เตรียมเส้นทางการย้อนกลับและการตอบสนองต่อเหตุการณ์ก่อนปรับขนาด ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

สำรวจต่อไป