คู่มือ AI แบบเห็นภาพ

คำแนะนำแบบไม่มีลักษณนาม

คำแนะนำที่ไม่ต้องใช้ตัวแยกประเภทเป็นเทคนิคที่ทำให้แบบจำลองการแพร่กระจายเป็นไปตามคำแนะนำของคุณจริง ๆ โดยแลกความหลากหลายบางอย่างเพื่อการยึดเกาะที่แข็งแกร่งยิ่งขึ้น

ภาพรวม

คำแนะนำที่ไม่ต้องใช้ตัวแยกประเภทเป็นเทคนิคที่ทำให้แบบจำลองการแพร่กระจายเป็นไปตามคำแนะนำของคุณจริง ๆ โดยแลกความหลากหลายบางอย่างเพื่อการยึดเกาะที่แข็งแกร่งยิ่งขึ้น มันเป็นวงแหวนเดียวที่อยู่ด้านหลังแถบเลื่อน 'มาตราส่วนนำทาง' ในเครื่องสร้างภาพเกือบทุกเครื่อง

คำแนะนำแบบไม่มีตัวแยกประเภทเป็นของเวิร์กโฟลว์คอมพิวเตอร์วิทัศน์ที่ตีความหรือสร้างสื่อภาพเพื่อการวิเคราะห์ การดำเนินงาน และความคิดสร้างสรรค์

เจาะลึก

การแพร่กระจายที่มีการนำทางตั้งแต่เนิ่นๆ จำเป็นต้องมีตัวแยกประเภทแยกต่างหากเพื่อดันตัวอย่างไปยังประเภทที่ต้องการ ซึ่งเปราะบางและต้องมีการฝึกอบรมเพิ่มเติม คำแนะนำที่ไม่ต้องใช้ตัวแยกประเภทซึ่งเสนอโดย Jonathan Ho และ Tim Salimans ในปี 2022 จะนำการพึ่งพานั้นออกไป ในระหว่างการฝึก โมเดลจะสุ่มวางเงื่อนไข (ข้อความแจ้ง) บางเปอร์เซ็นต์ของเวลา ดังนั้นจึงเรียนรู้ที่จะสร้างการคาดการณ์ทั้งแบบมีเงื่อนไขและไม่มีเงื่อนไขด้วยเครือข่ายเดียว ในเวลาสุ่มตัวอย่าง คุณรันโมเดลสองครั้งต่อขั้นตอน ครั้งแรกพร้อมท์และอีกครั้งโดยไม่ต้อง จากนั้นจึงคาดการณ์จากการคาดคะเนแบบไม่มีเงื่อนไขไปสู่การคาดการณ์แบบมีเงื่อนไข ปริมาณของการประมาณค่าเป็นระดับแนวทาง: ค่าที่สูงกว่าจะบังคับการเกาะติดที่รวดเร็วยิ่งขึ้นและความอิ่มตัวของสีที่มากขึ้น ในขณะที่ค่าที่ต่ำกว่าจะให้ความหลากหลายมากกว่าแต่การจับคู่ที่หลวมกว่า

ข้อมูลเชิงลึกทางเทคนิค

ในทางคณิตศาสตร์ การทำนายเสียงนำทางคือการทำนายแบบไม่มีเงื่อนไขบวกกับมาตราส่วนการนำทางคูณด้วยความแตกต่างระหว่างการทำนายแบบมีเงื่อนไขและแบบไม่มีเงื่อนไข ระดับ 1 หมายถึงไม่มีคำแนะนำ ค่าทั่วไปคือ 5 ถึง 9 การกดสเกลที่สูงมากจะขยายคุณสมบัติพร้อมต์ แต่ทำให้เกิดสีที่อิ่มตัวมากเกินไป คอนทราสต์ที่รุนแรง และสิ่งแปลกปลอม เนื่องจากแบบจำลองคาดการณ์ไปไกลเกินกว่าการกระจายที่เรียนรู้ มีค่าใช้จ่ายประมาณสองส่งต่อต่อขั้นตอนการลดสัญญาณรบกวน

การเรียนรู้คำแนะนำแบบไม่มีลักษณนาม

คำแนะนำที่ไม่ต้องใช้ตัวแยกประเภทเป็นเทคนิคที่ทำให้แบบจำลองการแพร่กระจายเป็นไปตามคำแนะนำของคุณจริง ๆ โดยแลกความหลากหลายบางอย่างเพื่อการยึดเกาะที่แข็งแกร่งยิ่งขึ้น มันเป็นวงแหวนเดียวที่อยู่ด้านหลังแถบเลื่อน 'มาตราส่วนนำทาง' ในเครื่องสร้างภาพเกือบทุกเครื่อง คำแนะนำแบบไม่มีตัวแยกประเภทเป็นของเวิร์กโฟลว์คอมพิวเตอร์วิทัศน์ที่ตีความหรือสร้างสื่อภาพเพื่อการวิเคราะห์ การดำเนินงาน และความคิดสร้างสรรค์ หากต้องการสร้างความเข้าใจอย่างลึกซึ้ง ให้ถือว่าคำแนะนำแบบไม่ใช้ตัวแยกประเภทเป็นรูปแบบการดำเนินงาน ไม่ใช่คุณลักษณะเดียว: กำหนดผลลัพธ์ที่ต้องการ ชี้แจงสมมติฐาน และแยกสิ่งที่ระบบสามารถทำได้อย่างน่าเชื่อถือจากสิ่งที่ยังต้องใช้วิจารณญาณจากผู้เชี่ยวชาญ

ในทางปฏิบัติ ทีมที่แข็งแกร่งที่ใช้ Classifier-Free Guidance จะรักษาสมดุลระหว่างความแม่นยำกับความเป็นจริงในการปฏิบัติงาน เช่น คุณภาพของข้อมูล ความแปรปรวนของแสง และความสม่ำเสมอในการติดฉลาก โดยจะบันทึกเกณฑ์ความสำเร็จที่ชัดเจน ทดสอบกับข้อมูลและขั้นตอนการทำงานที่สมจริง และทำซ้ำตามรูปแบบความล้มเหลวที่สังเกตได้ แทนที่จะชนะการวัดประสิทธิภาพเพียงครั้งเดียว นี่คือจุดที่ความเข้าใจทางทฤษฎีกลายเป็นความสามารถที่คงทนของผลิตภัณฑ์ นโยบาย และการดำเนินงาน

Visual AI สามารถทำให้การตรวจสอบ การตรวจจับ และการแท็กเป็นอัตโนมัติในขนาดต่างๆ ในขณะเดียวกัน สิทธิ์และความยินยอมในรูปภาพอาจกลายเป็นความเสี่ยงทางกฎหมายได้หากแหล่งที่มาไม่ชัดเจน แนวทางที่ยืดหยุ่นที่สุดคือการรวมความเร็วของการทดลองเข้ากับวินัยในการกำกับดูแล: ดำเนินการนำร่อง จับหลักฐาน เผยแพร่บันทึกการตัดสินใจ และอัปเดตการป้องกันอย่างต่อเนื่องเมื่อพฤติกรรมของโมเดล ความคาดหวังของผู้ใช้ และข้อกำหนดด้านกฎระเบียบมีการเปลี่ยนแปลง

ผลกระทบเชิงกลยุทธ์

Visual AI สามารถทำให้การตรวจสอบ การตรวจจับ และการแท็กเป็นอัตโนมัติในขนาดต่างๆ

Visual AI สามารถทำให้การตรวจสอบ การตรวจจับ และการแท็กเป็นอัตโนมัติในขนาดต่างๆ ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

ทีมสร้างสรรค์สามารถสร้างต้นแบบแนวคิดได้รวดเร็วขึ้นโดยต้องมีการแก้ไขด้วยตนเองน้อยลง

ทีมสร้างสรรค์สามารถสร้างต้นแบบแนวคิดได้รวดเร็วขึ้นโดยต้องมีการแก้ไขด้วยตนเองน้อยลง ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

การดำเนินการสามารถใช้สัญญาณภาพและวิดีโอที่ก่อนหน้านี้ประมวลผลได้ยาก

การดำเนินการสามารถใช้สัญญาณภาพและวิดีโอที่ก่อนหน้านี้ประมวลผลได้ยาก ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

อนาคตของคำแนะนำแบบไม่มีตัวแยกประเภท

นักวิจัยกำลังปรับปรุงคำแนะนำเพื่อให้ยึดมั่นในทันทีโดยไม่ทำให้เกินความจำเป็น ผ่านการกำหนดเกณฑ์แบบไดนามิก กำหนดการคำแนะนำที่เปลี่ยนแปลงความแข็งแกร่งในแต่ละขั้นตอน และปรับขนาดเทคนิคต่างๆ ขณะนี้โมเดลที่กลั่นแล้วรวมการนำทางไว้ในการส่งผ่านเพียงครั้งเดียวเพื่อลดการประมวลผลลงครึ่งหนึ่ง และสูตรที่ใหม่กว่าจะสำรวจความสนใจที่ตกตะลึงและการนำทางอัตโนมัติซึ่งไม่จำเป็นต้องแยกย่อยโดยไม่มีเงื่อนไขเลย โดยมุ่งเป้าไปที่ภาพที่คมชัดและสมจริงด้วยต้นทุนที่ต่ำกว่า

การใช้งานจริงในโลกแห่งความเป็นจริง

การปรับแถบเลื่อน 'มาตราส่วน CFG' ใน Stable Diffusion หรือ Midjourney เพื่อสร้างสมดุลระหว่างความแม่นยำในทันทีกับความคิดสร้างสรรค์

การเพิ่มคำแนะนำเพื่อบังคับให้ตัวสร้างรวมวัตถุที่เฉพาะเจาะจงและยากต่อการเรนเดอร์ตามที่อธิบายไว้ในพรอมต์

ลดคำแนะนำลงเพื่อให้ได้ผลลัพธ์ที่หลากหลายมากขึ้น และมีความอิ่มตัวน้อยลง เมื่อสำรวจตัวเลือกการออกแบบมากมาย

การปรับแต่งตารางคำแนะนำในไปป์ไลน์การผลิตเพื่อลดปัญหาการเบิร์นสีในการเรนเดอร์ที่มีรายละเอียดสูง

รูปแบบการดำเนินงาน

คำแนะนำแบบไม่มีลักษณนามในทางปฏิบัติ

การปรับแถบเลื่อน 'สเกล CFG' ใน Stable Diffusion หรือ Midjourney เพื่อสร้างสมดุลระหว่างความแม่นยำในทันทีกับความคิดสร้างสรรค์

การปรับแถบเลื่อน 'มาตราส่วน CFG' ใน Stable Diffusion หรือ Midjourney เพื่อสร้างสมดุลระหว่างความแม่นยำในทันทีกับความคิดสร้างสรรค์ ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับ Edge Cases และติดตามทั้งประสิทธิภาพการทำงานที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

คำแนะนำแบบไม่มีลักษณนามในทางปฏิบัติ

การเพิ่มคำแนะนำเพื่อบังคับให้ตัวสร้างรวมวัตถุที่เฉพาะเจาะจงและยากต่อการเรนเดอร์ตามที่อธิบายไว้ในพรอมต์

การเพิ่มคำแนะนำเพื่อบังคับให้ตัวสร้างรวมวัตถุที่เฉพาะเจาะจงและเรนเดอร์ยากที่อธิบายไว้ในข้อความแจ้ง ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการทำงานที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

คำแนะนำแบบไม่มีลักษณนามในทางปฏิบัติ

ลดคำแนะนำลงเพื่อให้ได้ผลลัพธ์ที่หลากหลายมากขึ้น และมีความอิ่มตัวน้อยลง เมื่อสำรวจตัวเลือกการออกแบบมากมาย

การลดคำแนะนำเพื่อให้ได้ผลลัพธ์ที่หลากหลายและอิ่มตัวน้อยลงเมื่อสำรวจตัวเลือกการออกแบบจำนวนมาก ทีมมักจะได้รับผลลัพธ์ที่ดีขึ้นเมื่อกำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการผลิตที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

คำแนะนำแบบไม่มีลักษณนามในทางปฏิบัติ

การปรับแต่งตารางคำแนะนำในไปป์ไลน์การผลิตเพื่อลดปัญหาการเบิร์นสีในการเรนเดอร์ที่มีรายละเอียดสูง

การปรับแต่งกำหนดการคำแนะนำในไปป์ไลน์การผลิตเพื่อลดปัญหาการเบิร์นสีในการเรนเดอร์ที่มีรายละเอียดสูง ทีมมักจะได้รับผลลัพธ์ที่ดีขึ้น เมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการทำงานที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

ความเสี่ยงและรั้ว

!

สิทธิ์และความยินยอมในรูปภาพอาจกลายเป็นความเสี่ยงทางกฎหมายได้หากแหล่งที่มาไม่ชัดเจน

!

ประสิทธิภาพของโมเดลอาจแตกต่างกันไปตามสภาพแสง ข้อมูลประชากร และสภาพแวดล้อม

!

ผลบวกลวงอาจไม่สังเกตเห็นเว้นแต่จะมีการตรวจสอบเกณฑ์ความเชื่อมั่น

แผนงานการดำเนินงาน

1

กำหนดเกณฑ์การยอมรับสำหรับความแม่นยำ การเรียกคืน และต้นทุนข้อผิดพลาด

กำหนดเกณฑ์การยอมรับสำหรับความแม่นยำ การเรียกคืน และต้นทุนข้อผิดพลาด ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

2

ทดสอบด้วยข้อมูลที่ตรงกับเงื่อนไขการผลิตจริง

ทดสอบด้วยข้อมูลที่ตรงกับเงื่อนไขการผลิตจริง ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

3

เพิ่มการตรวจสอบโดยเจ้าหน้าที่สำหรับการคาดการณ์ที่มีความมั่นใจต่ำหรือมีผลกระทบสูง

เพิ่มการตรวจสอบโดยเจ้าหน้าที่สำหรับการคาดการณ์ที่มีความมั่นใจต่ำหรือมีผลกระทบสูง ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

4

ติดตามการเคลื่อนตัวของโมเดลและตรวจสอบความถูกต้องอีกครั้งหลังจากการเปลี่ยนแปลงกล้องหรือชุดข้อมูล

ติดตามการเคลื่อนตัวของโมเดลและตรวจสอบความถูกต้องอีกครั้งหลังจากการเปลี่ยนแปลงกล้องหรือชุดข้อมูล ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

สำรวจต่อไป