ภาพรวม
คำแนะนำที่ไม่ต้องใช้ตัวแยกประเภทเป็นเทคนิคที่ทำให้แบบจำลองการแพร่กระจายเป็นไปตามคำแนะนำของคุณจริง ๆ โดยแลกความหลากหลายบางอย่างเพื่อการยึดเกาะที่แข็งแกร่งยิ่งขึ้น มันเป็นวงแหวนเดียวที่อยู่ด้านหลังแถบเลื่อน 'มาตราส่วนนำทาง' ในเครื่องสร้างภาพเกือบทุกเครื่อง
คำแนะนำแบบไม่มีตัวแยกประเภทเป็นของเวิร์กโฟลว์คอมพิวเตอร์วิทัศน์ที่ตีความหรือสร้างสื่อภาพเพื่อการวิเคราะห์ การดำเนินงาน และความคิดสร้างสรรค์
เจาะลึก
การแพร่กระจายที่มีการนำทางตั้งแต่เนิ่นๆ จำเป็นต้องมีตัวแยกประเภทแยกต่างหากเพื่อดันตัวอย่างไปยังประเภทที่ต้องการ ซึ่งเปราะบางและต้องมีการฝึกอบรมเพิ่มเติม คำแนะนำที่ไม่ต้องใช้ตัวแยกประเภทซึ่งเสนอโดย Jonathan Ho และ Tim Salimans ในปี 2022 จะนำการพึ่งพานั้นออกไป ในระหว่างการฝึก โมเดลจะสุ่มวางเงื่อนไข (ข้อความแจ้ง) บางเปอร์เซ็นต์ของเวลา ดังนั้นจึงเรียนรู้ที่จะสร้างการคาดการณ์ทั้งแบบมีเงื่อนไขและไม่มีเงื่อนไขด้วยเครือข่ายเดียว ในเวลาสุ่มตัวอย่าง คุณรันโมเดลสองครั้งต่อขั้นตอน ครั้งแรกพร้อมท์และอีกครั้งโดยไม่ต้อง จากนั้นจึงคาดการณ์จากการคาดคะเนแบบไม่มีเงื่อนไขไปสู่การคาดการณ์แบบมีเงื่อนไข ปริมาณของการประมาณค่าเป็นระดับแนวทาง: ค่าที่สูงกว่าจะบังคับการเกาะติดที่รวดเร็วยิ่งขึ้นและความอิ่มตัวของสีที่มากขึ้น ในขณะที่ค่าที่ต่ำกว่าจะให้ความหลากหลายมากกว่าแต่การจับคู่ที่หลวมกว่า
ข้อมูลเชิงลึกทางเทคนิค
ในทางคณิตศาสตร์ การทำนายเสียงนำทางคือการทำนายแบบไม่มีเงื่อนไขบวกกับมาตราส่วนการนำทางคูณด้วยความแตกต่างระหว่างการทำนายแบบมีเงื่อนไขและแบบไม่มีเงื่อนไข ระดับ 1 หมายถึงไม่มีคำแนะนำ ค่าทั่วไปคือ 5 ถึง 9 การกดสเกลที่สูงมากจะขยายคุณสมบัติพร้อมต์ แต่ทำให้เกิดสีที่อิ่มตัวมากเกินไป คอนทราสต์ที่รุนแรง และสิ่งแปลกปลอม เนื่องจากแบบจำลองคาดการณ์ไปไกลเกินกว่าการกระจายที่เรียนรู้ มีค่าใช้จ่ายประมาณสองส่งต่อต่อขั้นตอนการลดสัญญาณรบกวน
การเรียนรู้คำแนะนำแบบไม่มีลักษณนาม
คำแนะนำที่ไม่ต้องใช้ตัวแยกประเภทเป็นเทคนิคที่ทำให้แบบจำลองการแพร่กระจายเป็นไปตามคำแนะนำของคุณจริง ๆ โดยแลกความหลากหลายบางอย่างเพื่อการยึดเกาะที่แข็งแกร่งยิ่งขึ้น มันเป็นวงแหวนเดียวที่อยู่ด้านหลังแถบเลื่อน 'มาตราส่วนนำทาง' ในเครื่องสร้างภาพเกือบทุกเครื่อง คำแนะนำแบบไม่มีตัวแยกประเภทเป็นของเวิร์กโฟลว์คอมพิวเตอร์วิทัศน์ที่ตีความหรือสร้างสื่อภาพเพื่อการวิเคราะห์ การดำเนินงาน และความคิดสร้างสรรค์ หากต้องการสร้างความเข้าใจอย่างลึกซึ้ง ให้ถือว่าคำแนะนำแบบไม่ใช้ตัวแยกประเภทเป็นรูปแบบการดำเนินงาน ไม่ใช่คุณลักษณะเดียว: กำหนดผลลัพธ์ที่ต้องการ ชี้แจงสมมติฐาน และแยกสิ่งที่ระบบสามารถทำได้อย่างน่าเชื่อถือจากสิ่งที่ยังต้องใช้วิจารณญาณจากผู้เชี่ยวชาญ
ในทางปฏิบัติ ทีมที่แข็งแกร่งที่ใช้ Classifier-Free Guidance จะรักษาสมดุลระหว่างความแม่นยำกับความเป็นจริงในการปฏิบัติงาน เช่น คุณภาพของข้อมูล ความแปรปรวนของแสง และความสม่ำเสมอในการติดฉลาก โดยจะบันทึกเกณฑ์ความสำเร็จที่ชัดเจน ทดสอบกับข้อมูลและขั้นตอนการทำงานที่สมจริง และทำซ้ำตามรูปแบบความล้มเหลวที่สังเกตได้ แทนที่จะชนะการวัดประสิทธิภาพเพียงครั้งเดียว นี่คือจุดที่ความเข้าใจทางทฤษฎีกลายเป็นความสามารถที่คงทนของผลิตภัณฑ์ นโยบาย และการดำเนินงาน
Visual AI สามารถทำให้การตรวจสอบ การตรวจจับ และการแท็กเป็นอัตโนมัติในขนาดต่างๆ ในขณะเดียวกัน สิทธิ์และความยินยอมในรูปภาพอาจกลายเป็นความเสี่ยงทางกฎหมายได้หากแหล่งที่มาไม่ชัดเจน แนวทางที่ยืดหยุ่นที่สุดคือการรวมความเร็วของการทดลองเข้ากับวินัยในการกำกับดูแล: ดำเนินการนำร่อง จับหลักฐาน เผยแพร่บันทึกการตัดสินใจ และอัปเดตการป้องกันอย่างต่อเนื่องเมื่อพฤติกรรมของโมเดล ความคาดหวังของผู้ใช้ และข้อกำหนดด้านกฎระเบียบมีการเปลี่ยนแปลง
ผลกระทบเชิงกลยุทธ์
Visual AI สามารถทำให้การตรวจสอบ การตรวจจับ และการแท็กเป็นอัตโนมัติในขนาดต่างๆ
Visual AI สามารถทำให้การตรวจสอบ การตรวจจับ และการแท็กเป็นอัตโนมัติในขนาดต่างๆ ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ
ทีมสร้างสรรค์สามารถสร้างต้นแบบแนวคิดได้รวดเร็วขึ้นโดยต้องมีการแก้ไขด้วยตนเองน้อยลง
ทีมสร้างสรรค์สามารถสร้างต้นแบบแนวคิดได้รวดเร็วขึ้นโดยต้องมีการแก้ไขด้วยตนเองน้อยลง ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ
การดำเนินการสามารถใช้สัญญาณภาพและวิดีโอที่ก่อนหน้านี้ประมวลผลได้ยาก
การดำเนินการสามารถใช้สัญญาณภาพและวิดีโอที่ก่อนหน้านี้ประมวลผลได้ยาก ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ
การใช้งานจริงในโลกแห่งความเป็นจริง
การปรับแถบเลื่อน 'มาตราส่วน CFG' ใน Stable Diffusion หรือ Midjourney เพื่อสร้างสมดุลระหว่างความแม่นยำในทันทีกับความคิดสร้างสรรค์
การเพิ่มคำแนะนำเพื่อบังคับให้ตัวสร้างรวมวัตถุที่เฉพาะเจาะจงและยากต่อการเรนเดอร์ตามที่อธิบายไว้ในพรอมต์
ลดคำแนะนำลงเพื่อให้ได้ผลลัพธ์ที่หลากหลายมากขึ้น และมีความอิ่มตัวน้อยลง เมื่อสำรวจตัวเลือกการออกแบบมากมาย
การปรับแต่งตารางคำแนะนำในไปป์ไลน์การผลิตเพื่อลดปัญหาการเบิร์นสีในการเรนเดอร์ที่มีรายละเอียดสูง
รูปแบบการดำเนินงาน
คำแนะนำแบบไม่มีลักษณนามในทางปฏิบัติ
การปรับแถบเลื่อน 'สเกล CFG' ใน Stable Diffusion หรือ Midjourney เพื่อสร้างสมดุลระหว่างความแม่นยำในทันทีกับความคิดสร้างสรรค์
การปรับแถบเลื่อน 'มาตราส่วน CFG' ใน Stable Diffusion หรือ Midjourney เพื่อสร้างสมดุลระหว่างความแม่นยำในทันทีกับความคิดสร้างสรรค์ ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับ Edge Cases และติดตามทั้งประสิทธิภาพการทำงานที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป
คำแนะนำแบบไม่มีลักษณนามในทางปฏิบัติ
การเพิ่มคำแนะนำเพื่อบังคับให้ตัวสร้างรวมวัตถุที่เฉพาะเจาะจงและยากต่อการเรนเดอร์ตามที่อธิบายไว้ในพรอมต์
การเพิ่มคำแนะนำเพื่อบังคับให้ตัวสร้างรวมวัตถุที่เฉพาะเจาะจงและเรนเดอร์ยากที่อธิบายไว้ในข้อความแจ้ง ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการทำงานที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป
คำแนะนำแบบไม่มีลักษณนามในทางปฏิบัติ
ลดคำแนะนำลงเพื่อให้ได้ผลลัพธ์ที่หลากหลายมากขึ้น และมีความอิ่มตัวน้อยลง เมื่อสำรวจตัวเลือกการออกแบบมากมาย
การลดคำแนะนำเพื่อให้ได้ผลลัพธ์ที่หลากหลายและอิ่มตัวน้อยลงเมื่อสำรวจตัวเลือกการออกแบบจำนวนมาก ทีมมักจะได้รับผลลัพธ์ที่ดีขึ้นเมื่อกำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการผลิตที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป
คำแนะนำแบบไม่มีลักษณนามในทางปฏิบัติ
การปรับแต่งตารางคำแนะนำในไปป์ไลน์การผลิตเพื่อลดปัญหาการเบิร์นสีในการเรนเดอร์ที่มีรายละเอียดสูง
การปรับแต่งกำหนดการคำแนะนำในไปป์ไลน์การผลิตเพื่อลดปัญหาการเบิร์นสีในการเรนเดอร์ที่มีรายละเอียดสูง ทีมมักจะได้รับผลลัพธ์ที่ดีขึ้น เมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการทำงานที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป
ความเสี่ยงและรั้ว
สิทธิ์และความยินยอมในรูปภาพอาจกลายเป็นความเสี่ยงทางกฎหมายได้หากแหล่งที่มาไม่ชัดเจน
ประสิทธิภาพของโมเดลอาจแตกต่างกันไปตามสภาพแสง ข้อมูลประชากร และสภาพแวดล้อม
ผลบวกลวงอาจไม่สังเกตเห็นเว้นแต่จะมีการตรวจสอบเกณฑ์ความเชื่อมั่น
แผนงานการดำเนินงาน
กำหนดเกณฑ์การยอมรับสำหรับความแม่นยำ การเรียกคืน และต้นทุนข้อผิดพลาด
กำหนดเกณฑ์การยอมรับสำหรับความแม่นยำ การเรียกคืน และต้นทุนข้อผิดพลาด ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น
ทดสอบด้วยข้อมูลที่ตรงกับเงื่อนไขการผลิตจริง
ทดสอบด้วยข้อมูลที่ตรงกับเงื่อนไขการผลิตจริง ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น
เพิ่มการตรวจสอบโดยเจ้าหน้าที่สำหรับการคาดการณ์ที่มีความมั่นใจต่ำหรือมีผลกระทบสูง
เพิ่มการตรวจสอบโดยเจ้าหน้าที่สำหรับการคาดการณ์ที่มีความมั่นใจต่ำหรือมีผลกระทบสูง ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น
ติดตามการเคลื่อนตัวของโมเดลและตรวจสอบความถูกต้องอีกครั้งหลังจากการเปลี่ยนแปลงกล้องหรือชุดข้อมูล
ติดตามการเคลื่อนตัวของโมเดลและตรวจสอบความถูกต้องอีกครั้งหลังจากการเปลี่ยนแปลงกล้องหรือชุดข้อมูล ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น