คู่มือบริษัท

การสร้างรหัส AI ริมสระน้ำ

Poolside เป็นโมเดลพื้นฐานสำหรับการสร้างสตาร์ทอัพด้าน AI ที่ได้รับทุนสนับสนุนอย่างดี ซึ่งเชี่ยวชาญด้านการพัฒนาซอฟต์แวร์โดยเฉพาะ

ภาพรวม

Poolside เป็นโมเดลพื้นฐานสำหรับการสร้างสตาร์ทอัพด้าน AI ที่ได้รับทุนสนับสนุนอย่างดี ซึ่งเชี่ยวชาญด้านการพัฒนาซอฟต์แวร์โดยเฉพาะ เดิมพันใหญ่คือการฝึกอบรมเกี่ยวกับผลตอบรับด้านวิศวกรรมซอฟต์แวร์จริง ไม่ใช่แค่โค้ดที่คัดลอกมา จะสร้างโมเดลที่ใช้โค้ดนอก LLM สำหรับวัตถุประสงค์ทั่วไป

การสร้างโค้ด AI ริมสระน้ำเป็นที่เข้าใจกันดีที่สุดในบริบทของกลยุทธ์ การเข้าถึงโมเดล การตัดสินใจของแพลตฟอร์ม และความร่วมมือในระบบนิเวศ

เจาะลึก

Poolside ก่อตั้งขึ้นในปี 2023 โดย Jason Warner (อดีต GitHub CTO) และ Eiso Kant โดยมุ่งมั่นที่จะสร้างโมเดลชายแดนที่มุ่งเป้าไปที่โค้ดมากกว่าแชทบอทโดยเฉพาะ แนวคิดที่เป็นเอกลักษณ์ของมันคือ Reinforcement Learning from Code Execution Feedback (RLCEF) แทนที่จะทำนายโทเค็นถัดไปเท่านั้น โมเดลจะเขียนโค้ด รันกับการทดสอบและคอมไพเลอร์ และเรียนรู้จากการทำงานจริงหรือไม่ Poolside ระดมทุนได้ประมาณ 626 ล้านดอลลาร์ในซีรีส์ B ปี 2024 ด้วยการประเมินมูลค่า 3 พันล้านดอลลาร์ โดยมีผู้สนับสนุนรวมถึง Bain Capital Ventures และ Nvidia ในเวลาต่อมา บริษัทขายให้กับองค์กรที่ต้องการใช้โมเดลโค้ดในสภาพแวดล้อมของตนเอง โดยเน้นความเป็นส่วนตัว การโฮสต์บนคลาวด์แบบ on-premise หรือไพรเวทคลาวด์ และผู้ช่วยที่ปรับให้เข้ากับพื้นที่เก็บข้อมูลภายในของลูกค้า แทนที่จะเป็น API สาธารณะที่ใช้ร่วมกัน

ข้อมูลเชิงลึกทางเทคนิค

RLCEF ถือว่าคอมไพลเลอร์และชุดทดสอบเป็นสัญญาณรางวัลอัตโนมัติ โมเดลจะสร้างโซลูชันที่ผู้สมัคร ดำเนินการ และการเรียนรู้แบบเสริมกำลังผลักดันน้ำหนักไปยังเอาต์พุตที่คอมไพล์และผ่านการทดสอบ เนื่องจากสามารถตรวจสอบความถูกต้องโดยทางโปรแกรมได้ Poolside จึงสามารถสร้างผลตอบรับการฝึกสังเคราะห์ได้อย่างไม่จำกัดอย่างมีประสิทธิภาพโดยไม่ต้องมีผู้ติดป้ายกำกับที่เป็นมนุษย์ ซึ่งเป็นลูปที่ปรับขนาดได้ซึ่งการฝึกล่วงหน้าโทเค็นถัดไปล้วนๆ บนที่เก็บโค้ดแบบคงที่ไม่สามารถให้ได้ด้วยตัวเอง

การเรียนรู้การสร้างโค้ด AI ริมสระน้ำอย่างเชี่ยวชาญ

Poolside เป็นโมเดลพื้นฐานสำหรับการสร้างสตาร์ทอัพด้าน AI ที่ได้รับทุนสนับสนุนอย่างดี ซึ่งเชี่ยวชาญด้านการพัฒนาซอฟต์แวร์โดยเฉพาะ เดิมพันใหญ่คือการฝึกอบรมเกี่ยวกับผลตอบรับด้านวิศวกรรมซอฟต์แวร์จริง ไม่ใช่แค่โค้ดที่คัดลอกมา จะสร้างโมเดลที่ใช้โค้ดนอก LLM สำหรับวัตถุประสงค์ทั่วไป การสร้างโค้ด AI ริมสระน้ำเป็นที่เข้าใจกันดีที่สุดในบริบทของกลยุทธ์ การเข้าถึงโมเดล การตัดสินใจของแพลตฟอร์ม และความร่วมมือในระบบนิเวศ เพื่อสร้างความเข้าใจอย่างลึกซึ้ง ให้ถือว่าการสร้างโค้ด AI ริมสระน้ำเป็นเพียงโมเดลการดำเนินงาน ไม่ใช่คุณลักษณะเดียว: กำหนดผลลัพธ์ที่ต้องการ ชี้แจงสมมติฐาน และแยกสิ่งที่ระบบสามารถทำได้อย่างน่าเชื่อถือจากสิ่งที่ยังต้องใช้วิจารณญาณจากผู้เชี่ยวชาญ

ในทางปฏิบัติ ทีมที่แข็งแกร่งที่ใช้การสร้างโค้ด Poolside AI จะประเมินกลยุทธ์ของผู้จำหน่าย ความน่าเชื่อถือของแผนงาน และความเสี่ยงในการล็อคอินก่อนตัดสินใจ โดยจะบันทึกเกณฑ์ความสำเร็จที่ชัดเจน ทดสอบกับข้อมูลและขั้นตอนการทำงานที่สมจริง และทำซ้ำตามรูปแบบความล้มเหลวที่สังเกตได้ แทนที่จะชนะการวัดประสิทธิภาพเพียงครั้งเดียว นี่คือจุดที่ความเข้าใจทางทฤษฎีกลายเป็นความสามารถที่คงทนของผลิตภัณฑ์ นโยบาย และการดำเนินงาน

โรดแมปของผู้จำหน่ายมีอิทธิพลต่อฟีเจอร์ที่ทีมของคุณสามารถสร้างได้ต่อไป ในขณะเดียวกัน การประกาศเปิดตัวอาจแซงหน้าความเสถียรในขั้นตอนการทำงานจริง แนวทางที่ยืดหยุ่นที่สุดคือการรวมความเร็วของการทดลองเข้ากับวินัยในการกำกับดูแล: ดำเนินการนำร่อง จับหลักฐาน เผยแพร่บันทึกการตัดสินใจ และอัปเดตการป้องกันอย่างต่อเนื่องเมื่อพฤติกรรมของโมเดล ความคาดหวังของผู้ใช้ และข้อกำหนดด้านกฎระเบียบมีการเปลี่ยนแปลง

ผลกระทบเชิงกลยุทธ์

โรดแมปของผู้จำหน่ายมีอิทธิพลต่อฟีเจอร์ที่ทีมของคุณสามารถสร้างได้ต่อไป

โรดแมปของผู้จำหน่ายมีอิทธิพลต่อฟีเจอร์ที่ทีมของคุณสามารถสร้างได้ต่อไป ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

ข้อกำหนดทางการค้าและตัวเลือกการใช้งานส่งผลต่อต้นทุนและความเสี่ยงในระยะยาว

ข้อกำหนดทางการค้าและตัวเลือกการใช้งานส่งผลต่อต้นทุนและความเสี่ยงในระยะยาว ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

สิ่งจูงใจของบริษัทจะกำหนดค่าเริ่มต้นของผลิตภัณฑ์ ท่าทางที่ปลอดภัย และความเปิดกว้าง

สิ่งจูงใจของบริษัทจะกำหนดค่าเริ่มต้นของผลิตภัณฑ์ ท่าทางที่ปลอดภัย และความเปิดกว้าง ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

อนาคตของการสร้างโค้ด AI ริมสระน้ำ

Poolside กำลังแข่งกับคู่แข่งอย่าง OpenAI, Anthropic และ Cursor เพื่อเป็นเจ้าของการสร้างโค้ดระดับองค์กร คาดหวังความสามารถด้านเอเจนต์ที่ลึกยิ่งขึ้น (การแก้ไขหลายไฟล์ งานอัตโนมัติให้เสร็จสิ้น) การใช้งานภายในองค์กรที่เข้มงวดยิ่งขึ้นสำหรับอุตสาหกรรมที่ได้รับการควบคุม และการปรับขนาดการประมวลผลที่สนับสนุนโดย Nvidia คำถามสำคัญคือว่าโมเดลพื้นฐานที่ใช้โค้ดเท่านั้นสามารถก้าวนำหน้าโมเดลขอบเขตทั่วไปที่พัฒนาอย่างต่อเนื่องในการเขียนโปรแกรมหรือไม่ และองค์กรต่างๆ จะต้องจ่ายเงินระดับพรีเมียมเพื่อความเป็นส่วนตัวและการปรับแต่งหรือไม่

การใช้งานจริงในโลกแห่งความเป็นจริง

การปรับใช้ตัวช่วยเขียนโค้ดส่วนตัวภายในโครงสร้างพื้นฐานของธนาคาร ดังนั้นซอร์สโค้ดที่เป็นกรรมสิทธิ์จึงไม่หลุดออกจากไฟร์วอลล์

การสร้างและตรวจสอบการทดสอบหน่วยอัตโนมัติโดยเรียกใช้การทดสอบในแซนด์บ็อกซ์ก่อนที่จะแนะนำให้กับนักพัฒนา

ช่วยให้องค์กรปรับปรุงฐานโค้ดเดิมขนาดใหญ่ให้ทันสมัยด้วยคำแนะนำแบบจำลองที่ปรับให้เหมาะกับไลบรารีภายในของบริษัทนั้น

การให้การเติมข้อความอัตโนมัติและการเขียนโค้ดตามการแชทช่วยปรับแต่งพื้นที่เก็บข้อมูลเฉพาะของลูกค้าและแบบแผนการเขียนโค้ด

รูปแบบการดำเนินงาน

การสร้างโค้ด AI ริมสระน้ำในทางปฏิบัติ

การปรับใช้ตัวช่วยเขียนโค้ดส่วนตัวภายในโครงสร้างพื้นฐานของธนาคาร ดังนั้นซอร์สโค้ดที่เป็นกรรมสิทธิ์จึงไม่หลุดออกจากไฟร์วอลล์

การปรับใช้ผู้ช่วยโค้ดส่วนตัวภายในโครงสร้างพื้นฐานของธนาคาร ดังนั้นซอร์สโค้ดที่เป็นกรรมสิทธิ์จะไม่หลุดออกจากไฟร์วอลล์ ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการทำงานที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

การสร้างโค้ด AI ริมสระน้ำในทางปฏิบัติ

การสร้างและตรวจสอบการทดสอบหน่วยอัตโนมัติโดยเรียกใช้การทดสอบในแซนด์บ็อกซ์ก่อนที่จะแนะนำให้กับนักพัฒนา

การสร้างและตรวจสอบความถูกต้องอัตโนมัติของการทดสอบหน่วยโดยการเรียกใช้การทดสอบในแซนด์บ็อกซ์ก่อนที่จะแนะนำให้กับนักพัฒนา ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการทำงานที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

การสร้างโค้ด AI ริมสระน้ำในทางปฏิบัติ

ช่วยให้องค์กรปรับปรุงฐานโค้ดเดิมขนาดใหญ่ให้ทันสมัยด้วยคำแนะนำแบบจำลองที่ปรับให้เหมาะกับไลบรารีภายในของบริษัทนั้น

ช่วยให้องค์กรปรับปรุงฐานโค้ดเดิมขนาดใหญ่ให้ทันสมัยด้วยคำแนะนำแบบจำลองที่ปรับให้เหมาะกับไลบรารีภายในของบริษัทนั้น ทีมมักจะได้รับผลลัพธ์ที่ดีขึ้นเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการทำงานที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

การสร้างโค้ด AI ริมสระน้ำในทางปฏิบัติ

การให้การเติมข้อความอัตโนมัติและการเขียนโค้ดตามการแชทช่วยปรับแต่งพื้นที่เก็บข้อมูลเฉพาะของลูกค้าและแบบแผนการเขียนโค้ด

การให้การเติมข้อความอัตโนมัติและการเขียนโค้ดตามการแชทช่วยปรับแต่งพื้นที่เก็บข้อมูลเฉพาะของลูกค้าและแบบแผนการเขียนโค้ด ทีมมักจะได้รับผลลัพธ์ที่ดีขึ้นเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการทำงานที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

ความเสี่ยงและรั้ว

!

การประกาศเปิดตัวอาจแซงหน้าความเสถียรในขั้นตอนการทำงานจริง

!

การกำหนดราคา API หรือการเปลี่ยนแปลงนโยบายสามารถทำลายสมมติฐานได้ในชั่วข้ามคืน

!

การพึ่งพาผู้ขายรายเดียวจะเพิ่มค่าใช้จ่ายในการล็อคอินและการย้ายข้อมูล

แผนงานการดำเนินงาน

1

ประเมินผู้ให้บริการโดยใช้งานและชุดข้อมูลของคุณเอง

ประเมินผู้ให้บริการโดยใช้งานและชุดข้อมูลของคุณเอง ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

2

ตรวจสอบความเป็นส่วนตัว ความปลอดภัย และข้อกำหนดทางกฎหมายก่อนรวมระบบ

ตรวจสอบความเป็นส่วนตัว ความปลอดภัย และข้อกำหนดทางกฎหมายก่อนรวมระบบ ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

3

รักษาแผนสำรองสำหรับรุ่นหรือผู้จำหน่าย

รักษาแผนสำรองสำหรับรุ่นหรือผู้จำหน่าย ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

4

ตรวจสอบบันทึกประจำรุ่นเพื่อให้การเปลี่ยนแปลงแผนงานไม่ทำให้ทีมแปลกใจ

ตรวจสอบบันทึกประจำรุ่นเพื่อให้การเปลี่ยนแปลงแผนงานไม่ทำให้ทีมแปลกใจ ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

สำรวจต่อไป