جائزہ
جنریٹو ایجنٹ زبان کے ماڈلز سے چلنے والے AI کردار ہیں جو قابل اعتماد لوگوں کی طرح یاد رکھتے ہیں، منصوبہ بناتے ہیں اور رد عمل ظاہر کرتے ہیں۔ ایک نقلی دنیا میں ایک ساتھ رکھے ہوئے، وہ چھوٹے چھوٹے معاشرے بناتے ہیں جہاں سماجی رویہ خود ہی ابھرتا ہے۔
جنریٹو ایجنٹس اور سمولیٹڈ سوسائٹیز ایک تکنیکی تعمیراتی بلاک ہے جو ماڈل کے معیار، بنیادی ڈھانچے کی لاگت، تاخیر اور پیمانے پر قابل اعتماد کو متاثر کرتا ہے۔
گہرا غوطہ
2023 کے اسٹینفورڈ اور Google پروجیکٹ میں جسے Smallville کہا جاتا ہے، محققین نے GPT-3.5 سے چلنے والے 25 ایجنٹوں کو ایک سینڈ باکس ٹاؤن میں رکھا اور انہیں ایک کمیونٹی کی طرح برتاؤ کرتے ہوئے دیکھا۔ ہر ایجنٹ کی ایک مختصر سوانح عمری تھی اور وہ اٹھے، ناشتہ پکایا، کام پر گیا، اور پڑوسیوں کے ساتھ گپ شپ کی۔ اہم بات یہ ہے کہ سلوک اسکرپٹ نہیں تھا۔ ایک ایجنٹ نے ویلنٹائن ڈے پارٹی کرنے کا فیصلہ کیا، اور دو نقلی دنوں میں دعوت نامہ منہ کے ذریعے پھیل گیا، ایجنٹوں نے وقت کو مربوط کیا، اور کئی ایک ساتھ دکھائے گئے۔ آرکیٹیکچر میموری اسٹریم، بازیافت، عکاسی اور منصوبہ بندی کو یکجا کرتا ہے، لہذا ایجنٹ منٹوں پہلے جو کچھ ہوا اسے بھولنے کے بجائے طویل عرصے تک کام کرتے ہیں۔
تکنیکی بصیرت
بنیادی چال ایک میموری سٹریم ہے: ہر چیز کا ایک لمبا، ٹائم اسٹیمپڈ لاگ جو ایک ایجنٹ دیکھتا ہے۔ عمل کرنے کے لیے، ایجنٹ رجعت، اہمیت، اور موجودہ صورت حال سے مماثلت کے لحاظ سے متعلقہ یادیں بازیافت کرتا ہے، پھر انہیں لینگویج ماڈل پرامپٹ میں فیڈ کرتا ہے۔ متواتر عکاسی کے اقدامات خام یادوں کا خلاصہ اعلیٰ سطحی بصیرت میں پیش کرتے ہیں (مثال کے طور پر، یہ اندازہ لگانا کہ کوئی تحقیق کے بارے میں پرجوش ہے)، جو واپس محفوظ ہو جاتے ہیں اور مستقبل کی منصوبہ بندی اور مکالمے کی رہنمائی کرتے ہیں۔
تخلیقی ایجنٹوں اور نقلی معاشروں میں مہارت حاصل کرنا
جنریٹو ایجنٹ زبان کے ماڈلز سے چلنے والے AI کردار ہیں جو قابل اعتماد لوگوں کی طرح یاد رکھتے ہیں، منصوبہ بناتے ہیں اور رد عمل ظاہر کرتے ہیں۔ ایک نقلی دنیا میں ایک ساتھ رکھے ہوئے، وہ چھوٹے چھوٹے معاشرے بناتے ہیں جہاں سماجی رویہ خود ہی ابھرتا ہے۔ جنریٹو ایجنٹس اور سمولیٹڈ سوسائٹیز ایک تکنیکی تعمیراتی بلاک ہے جو ماڈل کے معیار، بنیادی ڈھانچے کی لاگت، تاخیر اور پیمانے پر قابل اعتماد کو متاثر کرتا ہے۔ گہری تفہیم پیدا کرنے کے لیے، جنریٹو ایجنٹوں اور نقلی معاشروں کو ایک آپریٹنگ ماڈل کے طور پر پیش کریں، نہ کہ ایک خصوصیت: مطلوبہ نتائج کی وضاحت کریں، مفروضوں کو واضح کریں، اور اس سے الگ کریں کہ سسٹم کیا قابل اعتماد طریقے سے کر سکتا ہے جس کے لیے ابھی بھی ماہرانہ فیصلے کی ضرورت ہے۔
عملی طور پر، جنریٹو ایجنٹس اور نقلی معاشروں کا استعمال کرنے والی مضبوط ٹیمیں قابل اعتماد اور لاگت کے خلاف فن تعمیر، ڈیٹا، اور بنیادی ڈھانچے کے انتخاب کو بہتر بناتی ہیں۔ وہ واضح کامیابی کے معیار کی دستاویز کرتے ہیں، حقیقت پسندانہ ڈیٹا اور ورک فلو کے خلاف جانچ کرتے ہیں، اور ایک بار کی بینچ مارک جیت کے بجائے مشاہدہ شدہ ناکامی کے نمونوں کی بنیاد پر اعادہ کرتے ہیں۔ یہ وہ جگہ ہے جہاں نظریاتی تفہیم مصنوعات، پالیسی اور آپریشنز میں پائیدار صلاحیت میں بدل جاتی ہے۔
فن تعمیر کے فیصلے سالوں تک کارکردگی اور آپریٹنگ لاگت کو آگے بڑھاتے ہیں۔ ایک ہی وقت میں، ایک بینچ مارک کو بہتر بنانا نظام کی وسیع تر کمزوریوں کو چھپا سکتا ہے۔ سب سے زیادہ لچکدار طریقہ یہ ہے کہ تجرباتی رفتار کو حکمرانی کے نظم و ضبط کے ساتھ ملایا جائے: پائلٹ چلائیں، شواہد حاصل کریں، فیصلے کے نوشتہ جات شائع کریں، اور ماڈل رویے، صارف کی توقعات، اور ریگولیٹری تقاضوں کے ارتقا کے ساتھ ساتھ حفاظتی اقدامات کو مسلسل اپ ڈیٹ کریں۔
اسٹریٹجک اثر
فن تعمیر کے فیصلے سالوں تک کارکردگی اور آپریٹنگ لاگت کو آگے بڑھاتے ہیں۔
فن تعمیر کے فیصلے سالوں تک کارکردگی اور آپریٹنگ لاگت کو آگے بڑھاتے ہیں۔ اعلیٰ معیار کی تعیناتیوں میں، اس کا ترجمہ قابل پیمائش آپریٹنگ قواعد، ملکیت کی حدود، اور بار بار نظرثانی کی رسومات میں کیا جاتا ہے تاکہ ٹیمیں ابہام کو بڑھانے کے بجائے اعتماد کو بڑھا سکیں۔
تکنیکی تعلیم ٹیموں کو صحیح اسٹیک منتخب کرنے میں مدد کرتی ہے، نہ صرف جدید ترین۔
تکنیکی تعلیم ٹیموں کو صحیح اسٹیک منتخب کرنے میں مدد کرتی ہے، نہ صرف جدید ترین۔ اعلیٰ معیار کی تعیناتیوں میں، اس کا ترجمہ قابل پیمائش آپریٹنگ قواعد، ملکیت کی حدود، اور بار بار نظرثانی کی رسومات میں کیا جاتا ہے تاکہ ٹیمیں ابہام کو بڑھانے کے بجائے اعتماد کو بڑھا سکیں۔
انجینئرنگ کے بہتر انتخاب پیداوار میں قابل اعتماد واقعات کو کم کرتے ہیں۔
انجینئرنگ کے بہتر انتخاب پیداوار میں قابل اعتماد واقعات کو کم کرتے ہیں۔ اعلیٰ معیار کی تعیناتیوں میں، اس کا ترجمہ قابل پیمائش آپریٹنگ قواعد، ملکیت کی حدود، اور بار بار نظرثانی کی رسومات میں کیا جاتا ہے تاکہ ٹیمیں ابہام کو بڑھانے کے بجائے اعتماد کو بڑھا سکیں۔
حقیقی دنیا کا نفاذ
اسٹینفورڈ کا سمال ویل سمولیشن جہاں 25 ایجنٹوں نے خودمختار طور پر ویلنٹائن ڈے پارٹی کا اہتمام کیا اور اس میں شرکت کی۔
ویڈیو گیمز میں قابل اعتماد، میموری سے چلنے والے NPCs جو کھلاڑیوں کے ماضی کے تعاملات کو یاد رکھتے ہیں اور رنجش یا دوستی رکھتے ہیں
مصنوعی فوکس گروپس جو مارکیٹنگ کے پیغامات یا پروڈکٹ کی خصوصیات کو پہلے سے جانچنے کے لیے متنوع کسٹمر شخصیات کا کردار ادا کرتے ہیں۔
تربیتی سمیلیٹر جہاں AI شہر کے لوگ آفات سے نمٹنے یا سفارت کاری کی مشقوں کے دوران ٹرینی کے فیصلوں پر ردعمل ظاہر کرتے ہیں۔
نفاذ کے پیٹرنز
عملی طور پر تخلیقی ایجنٹ اور نقلی معاشرے
Stanford's Smallville simulation جہاں 25 ایجنٹوں نے خودمختار طور پر ویلنٹائن ڈے پارٹی کا اہتمام کیا اور اس میں شرکت کی۔
Stanford's Smallville simulation جہاں 25 ایجنٹوں نے ویلنٹائن ڈے پارٹی کو خود مختار طور پر منظم کیا اور اس میں شرکت کی ٹیمیں عام طور پر اس وقت بہتر نتائج حاصل کرتی ہیں جب وہ سامنے کے معیار کی حد کی وضاحت کرتی ہیں، کنارے کے معاملات کے لیے انسانی اضافے کا راستہ رکھتی ہیں، اور وقت کے ساتھ ساتھ پیداواری فوائد اور غلطی کے اخراجات دونوں کو ٹریک کرتی ہیں۔
عملی طور پر تخلیقی ایجنٹ اور نقلی معاشرے
ویڈیو گیمز میں قابل اعتماد، میموری سے چلنے والے NPCs جو کھلاڑیوں کے ماضی کے تعاملات کو یاد رکھتے ہیں اور رنجش یا دوستی رکھتے ہیں۔
ویڈیو گیمز میں قابل اعتماد، میموری سے چلنے والے NPCs جو ماضی کے کھلاڑیوں کے تعاملات کو یاد رکھتے ہیں اور رنجشیں یا دوستی رکھتے ہیں ٹیمیں عام طور پر اس وقت بہتر نتائج حاصل کرتی ہیں جب وہ سامنے کے معیار کی حد کو متعین کرتی ہیں، کنارے کے معاملات کے لیے انسانی ترقی کا راستہ رکھتی ہیں، اور وقت کے ساتھ ساتھ پیداواری فوائد اور غلطی کے اخراجات دونوں کو ٹریک کرتی ہیں۔
عملی طور پر تخلیقی ایجنٹ اور نقلی معاشرے
مصنوعی فوکس گروپس جو مارکیٹنگ کے پیغامات یا پروڈکٹ کی خصوصیات کو پہلے سے جانچنے کے لیے متنوع کسٹمر شخصیات کا کردار ادا کرتے ہیں۔
مصنوعی فوکس گروپس جو مارکیٹنگ کے پیغامات یا مصنوعات کی خصوصیات کو جانچنے کے لیے متنوع کسٹمر شخصیات کا کردار ادا کرتے ہیں، ٹیمیں عام طور پر اس وقت بہتر نتائج حاصل کرتی ہیں جب وہ سامنے کے معیار کی حد کو متعین کرتی ہیں، کنارے کے معاملات کے لیے انسانی ترقی کا راستہ رکھتی ہیں، اور وقت کے ساتھ ساتھ پیداواری فوائد اور غلطی کے اخراجات دونوں کو ٹریک کرتی ہیں۔
عملی طور پر تخلیقی ایجنٹ اور نقلی معاشرے
تربیتی سمیلیٹر جہاں AI شہر کے لوگ آفات سے نمٹنے یا سفارت کاری کی مشقوں کے دوران ٹرینی کے فیصلوں پر ردعمل ظاہر کرتے ہیں۔
تربیتی سمیلیٹر جہاں AI شہر کے لوگ ڈیزاسٹر رسپانس یا ڈپلومیسی کی مشقوں کے دوران ٹرینی کے فیصلوں پر ردعمل ظاہر کرتے ہیں ٹیمیں عام طور پر اس وقت بہتر نتائج حاصل کرتی ہیں جب وہ سامنے کے معیار کی حد کو متعین کرتی ہیں، کنارے کے معاملات کے لیے انسانی ترقی کا راستہ رکھتی ہیں، اور وقت کے ساتھ ساتھ پیداواری فوائد اور غلطی کے اخراجات دونوں کو ٹریک کرتی ہیں۔
خطرات اور گارڈریلز
ایک بینچ مارک کو بہتر بنانا نظام کی وسیع تر کمزوریوں کو چھپا سکتا ہے۔
بنیادی ڈھانچے اور دیکھ بھال کے اخراجات کو اکثر کم سمجھا جاتا ہے۔
سیکورٹی اور مشاہداتی فرق بڑھ سکتا ہے کیونکہ نظام زیادہ پیچیدہ ہو جاتا ہے۔
نفاذ کا روڈ میپ
نفاذ سے پہلے تاخیر، معیار اور لاگت کے اہداف کی وضاحت کریں۔
نفاذ سے پہلے تاخیر، معیار اور لاگت کے اہداف کی وضاحت کریں۔ ہر قدم کو ثبوت کے دروازے کے طور پر دیکھیں: اگر معیار پر پورا نہیں اترتے ہیں، تو رول آؤٹ کو روک دیں، خلا کو بند کریں، اور تب ہی استعمال کو بڑھا دیں۔
حقیقت پسندانہ بوجھ اور ڈیٹا کی شرائط کے تحت بینچ مارک۔
حقیقت پسندانہ بوجھ اور ڈیٹا کی شرائط کے تحت بینچ مارک۔ ہر قدم کو ثبوت کے دروازے کے طور پر دیکھیں: اگر معیار پر پورا نہیں اترتے ہیں، تو رول آؤٹ کو روک دیں، خلا کو بند کریں، اور تب ہی استعمال کو بڑھا دیں۔
غلطیوں، بڑھے ہوئے، اور صارف کے اثرات کے لیے آلے کی نگرانی۔
غلطیوں، بڑھے ہوئے، اور صارف کے اثرات کے لیے آلے کی نگرانی۔ ہر قدم کو ثبوت کے دروازے کے طور پر دیکھیں: اگر معیار پر پورا نہیں اترتے ہیں، تو رول آؤٹ کو روک دیں، خلا کو بند کریں، اور تب ہی استعمال کو بڑھا دیں۔
اسکیلنگ سے پہلے رول بیک اور واقعہ کے ردعمل کے راستے تیار کریں۔
اسکیلنگ سے پہلے رول بیک اور واقعہ کے ردعمل کے راستے تیار کریں۔ ہر قدم کو ثبوت کے دروازے کے طور پر دیکھیں: اگر معیار پر پورا نہیں اترتے ہیں، تو رول آؤٹ کو روک دیں، خلا کو بند کریں، اور تب ہی استعمال کو بڑھا دیں۔