ภาพรวม
ต้นไม้แห่งความคิดช่วยให้แบบจำลองสำรวจเส้นทางการใช้เหตุผลหลายเส้นทางไปพร้อมๆ กัน เช่น กิ่งก้านของต้นไม้ แทนที่จะมุ่งมั่นกับแนวความคิดเส้นเดียว สามารถมองไปข้างหน้า ประเมินวิธีแก้ปัญหาบางส่วน และย้อนรอยจากทางตันได้
การใช้เหตุผลแบบต้นไม้แห่งความคิดเป็นองค์ประกอบทางเทคนิคที่ส่งผลต่อคุณภาพของโมเดล ต้นทุนโครงสร้างพื้นฐาน เวลาแฝง และความน่าเชื่อถือในวงกว้าง
เจาะลึก
แนะนำโดยเหยาและคณะ ในปี 2023 Tree-of-Thoughts (ToT) จะสรุปการกระตุ้นแบบลูกโซ่แห่งความคิด เมื่อห่วงโซ่แห่งความคิดสร้างลำดับเชิงเส้นตรงของขั้นตอนการให้เหตุผล ToT จะจัดโครงสร้างปัญหาเป็นแผนผัง: แต่ละโหนดเป็นวิธีแก้ปัญหาบางส่วน ("ความคิด") และแบบจำลองจะสร้างความคิดถัดไปที่เป็นตัวเลือกหลายรายการจากแต่ละโหนด ขั้นตอนการประเมินที่แยกออกมาจะให้คะแนนว่าแต่ละสาขามีแนวโน้มที่ดีเพียงใด และอัลกอริธึมการค้นหา เช่น การค้นหาแบบกว้างก่อนหรือลึกก่อนจะตัดสินใจว่าจะขยายสาขาใดและควรตัดสาขาใด ซึ่งช่วยให้โมเดลจงใจสำรวจ มองไปข้างหน้า 2-3 ก้าว และย้อนรอยเมื่อเส้นทางดูไม่มีแนวโน้มดี ToT ฉายแววภารกิจที่เอาชนะการใช้เหตุผลแบบเส้นทางเดียวอันละโมบ โดยที่โด่งดังที่สุดคือเกม 24 โดยที่ GPT-4 ที่มีห่วงโซ่แห่งความคิดสามารถไขปริศนาได้ประมาณ 4% แต่ ToT ผลักดันความสำเร็จเป็นประมาณ 74%
ข้อมูลเชิงลึกทางเทคนิค
ToT มีสามส่วน: เครื่องกำเนิดความคิดที่เสนอขั้นตอนต่อไปของผู้สมัคร ผู้ประเมินของรัฐ (มักจะเป็น LLM เดียวกันที่ได้รับแจ้งให้ให้คะแนนหรือลงคะแนนในวิธีแก้ปัญหาบางส่วนว่า 'แน่นอน / อาจจะ / เป็นไปไม่ได้') และขั้นตอนการค้นหา (BFS, DFS หรือการค้นหาแบบลำแสง) ที่นำทางแผนผัง เนื่องจากโมเดลประเมินสถานะบางส่วนและตัดกิ่งที่อ่อนแอ โมเดลจึงจัดสรรการประมวลผลไปยังขอบเขตที่เป็นไปได้ของพื้นที่โซลูชัน การแลกเปลี่ยนการอนุมานเพิ่มเติมจำเป็นต้องมีความแม่นยำที่สูงขึ้นอย่างมากในปัญหาที่ยาก
การเรียนรู้การใช้เหตุผลแบบต้นไม้แห่งความคิด
ต้นไม้แห่งความคิดช่วยให้แบบจำลองสำรวจเส้นทางการใช้เหตุผลหลายเส้นทางไปพร้อมๆ กัน เช่น กิ่งก้านของต้นไม้ แทนที่จะมุ่งมั่นกับแนวความคิดเส้นเดียว สามารถมองไปข้างหน้า ประเมินวิธีแก้ปัญหาบางส่วน และย้อนรอยจากทางตันได้ การใช้เหตุผลแบบต้นไม้แห่งความคิดเป็นองค์ประกอบทางเทคนิคที่ส่งผลต่อคุณภาพของโมเดล ต้นทุนโครงสร้างพื้นฐาน เวลาแฝง และความน่าเชื่อถือในวงกว้าง เพื่อสร้างความเข้าใจอย่างลึกซึ้ง ให้ถือว่าการใช้เหตุผลแบบต้นไม้แห่งความคิดเป็นรูปแบบการดำเนินงาน ไม่ใช่คุณลักษณะเดียว: กำหนดผลลัพธ์ที่ต้องการ ชี้แจงสมมติฐาน และแยกสิ่งที่ระบบสามารถทำได้อย่างน่าเชื่อถือจากสิ่งที่ยังต้องใช้วิจารณญาณจากผู้เชี่ยวชาญ
ในทางปฏิบัติ ทีมที่แข็งแกร่งที่ใช้เหตุผลแบบต้นไม้แห่งความคิดจะปรับสถาปัตยกรรม ข้อมูล และตัวเลือกโครงสร้างพื้นฐานให้เหมาะสมโดยเทียบกับความน่าเชื่อถือและต้นทุน โดยจะบันทึกเกณฑ์ความสำเร็จที่ชัดเจน ทดสอบกับข้อมูลและขั้นตอนการทำงานที่สมจริง และทำซ้ำตามรูปแบบความล้มเหลวที่สังเกตได้ แทนที่จะชนะการวัดประสิทธิภาพเพียงครั้งเดียว นี่คือจุดที่ความเข้าใจทางทฤษฎีกลายเป็นความสามารถที่คงทนของผลิตภัณฑ์ นโยบาย และการดำเนินงาน
การตัดสินใจด้านสถาปัตยกรรมขับเคลื่อนประสิทธิภาพและต้นทุนการดำเนินงานเป็นเวลาหลายปี ในเวลาเดียวกัน การเพิ่มประสิทธิภาพเกณฑ์มาตรฐานหนึ่งรายการสามารถซ่อนจุดอ่อนของระบบในวงกว้างได้ แนวทางที่ยืดหยุ่นที่สุดคือการรวมความเร็วของการทดลองเข้ากับวินัยในการกำกับดูแล: ดำเนินการนำร่อง จับหลักฐาน เผยแพร่บันทึกการตัดสินใจ และอัปเดตการป้องกันอย่างต่อเนื่องเมื่อพฤติกรรมของโมเดล ความคาดหวังของผู้ใช้ และข้อกำหนดด้านกฎระเบียบมีการเปลี่ยนแปลง
ผลกระทบเชิงกลยุทธ์
การตัดสินใจด้านสถาปัตยกรรมขับเคลื่อนประสิทธิภาพและต้นทุนการดำเนินงานเป็นเวลาหลายปี
การตัดสินใจด้านสถาปัตยกรรมขับเคลื่อนประสิทธิภาพและต้นทุนการดำเนินงานเป็นเวลาหลายปี ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ
การศึกษาด้านเทคนิคช่วยให้ทีมเลือกกลุ่มที่เหมาะสม ไม่ใช่แค่กลุ่มใหม่ล่าสุด
การศึกษาด้านเทคนิคช่วยให้ทีมเลือกกลุ่มที่เหมาะสม ไม่ใช่แค่กลุ่มใหม่ล่าสุด ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ
ตัวเลือกทางวิศวกรรมที่ดีกว่าจะช่วยลดเหตุการณ์ด้านความน่าเชื่อถือในการผลิต
ตัวเลือกทางวิศวกรรมที่ดีกว่าจะช่วยลดเหตุการณ์ด้านความน่าเชื่อถือในการผลิต ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ
การใช้งานจริงในโลกแห่งความเป็นจริง
แก้เกม 24 โดยการแยกตัวเลขสองตัวมารวมกันก่อน และตัดเส้นทางเลขคณิตที่ไม่สามารถเข้าถึง 24 ได้
การเขียนเชิงสร้างสรรค์ที่มีแผนที่สอดคล้องกัน โดยที่แบบจำลองจะร่างโครงร่างโครงเรื่องต่างๆ ประเมิน และขยายส่วนที่แข็งแกร่งที่สุดก่อนที่จะเขียนร้อยแก้ว
ปริศนาที่มีข้อจำกัด เช่น ปริศนาอักษรไขว้ขนาดเล็ก โดยแต่ละคำที่เติมไว้เป็นเพียงความคิด และกิ่งก้านที่เข้ากันไม่ได้จะถูกละทิ้ง
ปัญหาทางคณิตศาสตร์หรือการวางแผนแบบหลายขั้นตอนที่แบบจำลองสำรวจขั้นตอนกลางทางเลือกและการย้อนรอยจากขั้นตอนที่ฝ่าฝืนข้อจำกัด
รูปแบบการดำเนินงาน
การใช้เหตุผลแบบต้นไม้แห่งความคิดในทางปฏิบัติ
แก้เกม 24 โดยการแยกตัวเลขสองตัวมารวมกันก่อน และตัดเส้นทางเลขคณิตที่ไม่สามารถเข้าถึง 24 ได้
การแก้เกม 24 โดยการแยกตัวเลขสองตัวมารวมกันก่อน และการตัดเส้นทางเลขคณิตที่ไม่สามารถเข้าถึง 24 ทีมมักจะได้ผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการทำงานที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป
การใช้เหตุผลแบบต้นไม้แห่งความคิดในทางปฏิบัติ
การเขียนเชิงสร้างสรรค์ที่มีแผนที่สอดคล้องกัน โดยที่แบบจำลองจะร่างโครงร่างโครงเรื่องต่างๆ ประเมิน และขยายส่วนที่แข็งแกร่งที่สุดก่อนที่จะเขียนร้อยแก้ว
การเขียนเชิงสร้างสรรค์ด้วยแผนที่สอดคล้องกัน โดยที่แบบจำลองจะร่างเค้าโครงโครงเรื่องหลายเรื่อง ประเมิน และขยายส่วนที่แข็งแกร่งที่สุดก่อนที่จะเขียนร้อยแก้ว ทีมมักจะได้ผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับของมนุษย์สำหรับกรณีขอบ และติดตามทั้งการเพิ่มผลผลิตและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป
การใช้เหตุผลแบบต้นไม้แห่งความคิดในทางปฏิบัติ
ปริศนาที่มีข้อจำกัด เช่น ปริศนาอักษรไขว้ขนาดเล็ก โดยแต่ละคำที่เติมไว้เป็นเพียงความคิด และกิ่งก้านที่เข้ากันไม่ได้จะถูกละทิ้ง
ปริศนาที่มีข้อจำกัด เช่น ปริศนาอักษรไขว้ขนาดเล็ก ซึ่งคำแต่ละคำเป็นเพียงความคิด และสาขาที่เข้ากันไม่ได้จะถูกละทิ้ง ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการทำงานที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป
การใช้เหตุผลแบบต้นไม้แห่งความคิดในทางปฏิบัติ
ปัญหาทางคณิตศาสตร์หรือการวางแผนแบบหลายขั้นตอนที่แบบจำลองสำรวจขั้นตอนกลางทางเลือกและการย้อนรอยจากขั้นตอนที่ฝ่าฝืนข้อจำกัด
ปัญหาทางคณิตศาสตร์หรือการวางแผนแบบหลายขั้นตอนที่แบบจำลองสำรวจขั้นตอนกลางทางเลือกและการย้อนรอยจากขั้นตอนที่ฝ่าฝืนข้อจำกัด ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการทำงานที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป
ความเสี่ยงและรั้ว
การเพิ่มประสิทธิภาพเกณฑ์มาตรฐานหนึ่งรายการสามารถซ่อนจุดอ่อนของระบบในวงกว้างได้
ต้นทุนโครงสร้างพื้นฐานและการบำรุงรักษามักถูกประเมินต่ำไป
ช่องว่างด้านความปลอดภัยและความสามารถในการสังเกตสามารถเพิ่มขึ้นได้เมื่อระบบมีความซับซ้อนมากขึ้น
แผนงานการดำเนินงาน
กำหนดเป้าหมายเวลาแฝง คุณภาพ และต้นทุนก่อนนำไปใช้งาน
กำหนดเป้าหมายเวลาแฝง คุณภาพ และต้นทุนก่อนนำไปใช้งาน ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น
เกณฑ์มาตรฐานภายใต้สภาวะโหลดและข้อมูลจริง
เกณฑ์มาตรฐานภายใต้สภาวะโหลดและข้อมูลจริง ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น
การตรวจสอบเครื่องมือเพื่อหาข้อผิดพลาด การเบี่ยงเบน และผลกระทบต่อผู้ใช้
การตรวจสอบเครื่องมือเพื่อหาข้อผิดพลาด การเบี่ยงเบน และผลกระทบต่อผู้ใช้ ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น
เตรียมเส้นทางการย้อนกลับและการตอบสนองต่อเหตุการณ์ก่อนปรับขนาด
เตรียมเส้นทางการย้อนกลับและการตอบสนองต่อเหตุการณ์ก่อนปรับขนาด ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น