প্রযুক্তিগত গাইড

পরিকল্পনা এবং সমাধান প্রম্পটিং

প্ল্যান-এন্ড-সল্ভ (PS) প্রম্পটিং একটি ভাষা মডেলকে প্রথমে একটি সুস্পষ্ট পরিকল্পনা তৈরি করতে এবং তারপর ধাপে ধাপে তা সম্পাদন করতে বলে, সেই ব্যর্থতাগুলিকে ঠিক করে যা 'আসুন ধাপে ধাপে চিন্তা করি' প্রম্পট করে।

ওভারভিউ

প্ল্যান-এন্ড-সল্ভ (PS) প্রম্পটিং একটি ভাষা মডেলকে প্রথমে একটি সুস্পষ্ট পরিকল্পনা তৈরি করতে এবং তারপর ধাপে ধাপে তা সম্পাদন করতে বলে, সেই ব্যর্থতাগুলিকে ঠিক করে যা 'আসুন ধাপে ধাপে চিন্তা করি' প্রম্পট করে। এটি একটি সাধারণ প্রম্পট টুইক যা অর্থপূর্ণভাবে কোনো অতিরিক্ত প্রশিক্ষণ ছাড়াই বহু-পদক্ষেপের যুক্তিকে বাড়িয়ে তোলে।

প্ল্যান-এন্ড-সলভ প্রম্পটিং হল একটি প্রযুক্তিগত বিল্ডিং ব্লক যা মডেলের গুণমান, পরিকাঠামোর খরচ, লেটেন্সি এবং স্কেলে নির্ভরযোগ্যতাকে প্রভাবিত করে।

গভীর ডুব

Lei Wang এবং সহকর্মীদের দ্বারা একটি 2023 ACL পেপারে উপস্থাপিত, প্ল্যান-এন্ড-সলভ প্রম্পটিং শূন্য-শট চেইন-অফ-থট-এর একটি নির্দিষ্ট দুর্বলতার প্রতিক্রিয়া ছিল: মডেলগুলি প্রায়শই পদক্ষেপগুলি এড়িয়ে যায়, ভুল গণনা করে বা প্রশ্নটি ভুল পড়ে। PS একক নির্দেশনা 'আসুন ধাপে ধাপে চিন্তা করি' একটি দুই-অংশের নির্দেশনা দিয়ে প্রতিস্থাপন করে: 'আসুন প্রথমে সমস্যাটি বুঝতে পারি এবং এটি সমাধানের জন্য একটি পরিকল্পনা তৈরি করি। তারপর, পরিকল্পনা বাস্তবায়ন করি এবং ধাপে ধাপে সমস্যার সমাধান করি।' একটি উন্নত বৈকল্পিক, PS+, প্রাসঙ্গিক ভেরিয়েবল বের করতে, মধ্যবর্তী ফলাফল গণনা করতে এবং সংখ্যাগুলিতে মনোযোগ দিতে অনুস্মারক যোগ করে। GSM8K এবং SVAMP-এর মতো বেঞ্চমার্কে, PS+ অল্প-শট চেইন-অফ-থট দিয়ে ব্যবধানের অনেকটাই বন্ধ করে দিয়েছে যখন প্রম্পটে কোনও কাজের উদাহরণের প্রয়োজন নেই।

প্রযুক্তিগত অন্তর্দৃষ্টি

প্রক্রিয়াটি সম্পূর্ণরূপে প্রম্পটে রয়েছে: কার্যকর করার আগে একটি পরিকল্পনার জন্য জিজ্ঞাসা করে, PS মডেলের অটোরিগ্রেসিভ জেনারেশনকে স্থানান্তরিত করে যাতে এটি প্রথমে উচ্চ-স্তরের উপগোল তৈরি করে, যা পরবর্তীতে বিশদ যুক্তিযুক্ত টোকেনগুলিকে শর্ত দেয়। এই বিচ্ছেদ 'মিসিং-স্টেপ' এবং গণনার ত্রুটি হ্রাস করে। PS+ আরও সুস্পষ্টভাবে ভেরিয়েবল এবং মধ্যবর্তী পরিমাণের নামকরণের মাধ্যমে মনোযোগ আকর্ষণ করে, হাতে লেখা উদাহরণের উপর নির্ভর না করে একটি স্ব-উত্পাদিত ভারা হিসাবে কাজ করে।

মাস্টারিং প্ল্যান-এন্ড-সলভ প্রম্পটিং

প্ল্যান-এন্ড-সল্ভ (PS) প্রম্পটিং একটি ভাষা মডেলকে প্রথমে একটি সুস্পষ্ট পরিকল্পনা তৈরি করতে এবং তারপর ধাপে ধাপে তা সম্পাদন করতে বলে, সেই ব্যর্থতাগুলিকে ঠিক করে যা 'আসুন ধাপে ধাপে চিন্তা করি' প্রম্পট করে। এটি একটি সাধারণ প্রম্পট টুইক যা অর্থপূর্ণভাবে কোনো অতিরিক্ত প্রশিক্ষণ ছাড়াই বহু-পদক্ষেপের যুক্তিকে বাড়িয়ে তোলে। প্ল্যান-এন্ড-সলভ প্রম্পটিং হল একটি প্রযুক্তিগত বিল্ডিং ব্লক যা মডেলের গুণমান, পরিকাঠামোর খরচ, লেটেন্সি এবং স্কেলে নির্ভরযোগ্যতাকে প্রভাবিত করে। গভীর বোঝাপড়া তৈরি করতে, পরিকল্পনা-এবং-সল্ভ প্রম্পটিংকে একটি অপারেটিং মডেল হিসাবে বিবেচনা করুন, একটি একক বৈশিষ্ট্য নয়: পছন্দসই ফলাফলগুলি সংজ্ঞায়িত করুন, অনুমানগুলি স্পষ্ট করুন এবং সিস্টেমটি নির্ভরযোগ্যভাবে কী করতে পারে তা এখনও বিশেষজ্ঞের বিচারের প্রয়োজন থেকে আলাদা করুন৷

অনুশীলনে, প্ল্যান-এন্ড-সল্ভ প্রম্পটিং ব্যবহার করে শক্তিশালী দলগুলি নির্ভরযোগ্যতা এবং খরচের বিপরীতে আর্কিটেকচার, ডেটা এবং অবকাঠামো পছন্দকে অপ্টিমাইজ করে। তারা সুস্পষ্ট সাফল্যের মাপকাঠি নথিভুক্ত করে, বাস্তবসম্মত ডেটা এবং কর্মপ্রবাহের বিরুদ্ধে পরীক্ষা করে এবং এককালীন বেঞ্চমার্ক জয়ের পরিবর্তে পর্যবেক্ষিত ব্যর্থতার ধরণগুলির উপর ভিত্তি করে পুনরাবৃত্তি করে। এখানেই তাত্ত্বিক বোঝাপড়া পণ্য, নীতি এবং অপারেশন জুড়ে টেকসই সক্ষমতায় পরিণত হয়।

আর্কিটেকচারের সিদ্ধান্তগুলি বছরের পর বছর ধরে কর্মক্ষমতা এবং অপারেটিং খরচ চালায়। একই সময়ে, একটি বেঞ্চমার্ক অপ্টিমাইজ করা বৃহত্তর সিস্টেম দুর্বলতা আড়াল করতে পারে। সবচেয়ে স্থিতিস্থাপক পদ্ধতি হল প্রশাসনিক শৃঙ্খলার সাথে পরীক্ষার গতিকে একত্রিত করা: পাইলট চালান, প্রমাণ ক্যাপচার করুন, সিদ্ধান্তের লগ প্রকাশ করুন এবং মডেল আচরণ, ব্যবহারকারীর প্রত্যাশা এবং নিয়ন্ত্রক প্রয়োজনীয়তাগুলি বিকশিত হওয়ার সাথে সাথে অবিচ্ছিন্ন সুরক্ষাগুলি আপডেট করুন।

কৌশলগত প্রভাব

আর্কিটেকচারের সিদ্ধান্তগুলি বছরের পর বছর ধরে কর্মক্ষমতা এবং অপারেটিং খরচ চালায়।

আর্কিটেকচারের সিদ্ধান্তগুলি বছরের পর বছর ধরে কর্মক্ষমতা এবং অপারেটিং খরচ চালায়। উচ্চ-মানের স্থাপনায়, এটি পরিমাপযোগ্য অপারেটিং নিয়ম, মালিকানার সীমানা এবং পুনরাবৃত্ত পর্যালোচনার আচার-অনুষ্ঠানে অনুবাদ করা হয় যাতে দলগুলি অস্পষ্টতার পরিবর্তে আত্মবিশ্বাস বাড়াতে পারে।

কারিগরি শিক্ষা দলগুলোকে সঠিক স্ট্যাক বেছে নিতে সাহায্য করে, শুধু নতুনটি নয়।

কারিগরি শিক্ষা দলগুলোকে সঠিক স্ট্যাক বেছে নিতে সাহায্য করে, শুধু নতুনটি নয়। উচ্চ-মানের স্থাপনায়, এটি পরিমাপযোগ্য অপারেটিং নিয়ম, মালিকানার সীমানা এবং পুনরাবৃত্ত পর্যালোচনার আচার-অনুষ্ঠানে অনুবাদ করা হয় যাতে দলগুলি অস্পষ্টতার পরিবর্তে আত্মবিশ্বাস বাড়াতে পারে।

ভালো ইঞ্জিনিয়ারিং পছন্দ উৎপাদনে নির্ভরযোগ্যতার ঘটনা কমিয়ে দেয়।

ভালো ইঞ্জিনিয়ারিং পছন্দ উৎপাদনে নির্ভরযোগ্যতার ঘটনা কমিয়ে দেয়। উচ্চ-মানের স্থাপনায়, এটি পরিমাপযোগ্য অপারেটিং নিয়ম, মালিকানার সীমানা এবং পুনরাবৃত্ত পর্যালোচনার আচার-অনুষ্ঠানে অনুবাদ করা হয় যাতে দলগুলি অস্পষ্টতার পরিবর্তে আত্মবিশ্বাস বাড়াতে পারে।

প্ল্যান-এন্ড-সলভ প্রম্পটিংয়ের ভবিষ্যত

পরিকল্পনা এবং সমাধানের চিন্তাভাবনা এখন এজেন্ট ফ্রেমওয়ার্ক এবং 'রিজনিং' মডেলগুলিতে বেক করা হয়েছে যা স্থানীয়ভাবে পরিকল্পনাকে বাস্তবায়ন থেকে আলাদা করে। হাতিয়ার ব্যবহার, স্ব-যাচাইকরণ, এবং গাছ-অনুসন্ধান পদ্ধতির সাথে একত্রিত হওয়ার পরিকল্পনা প্রম্পট আশা করুন এবং ম্যানুয়াল প্রম্পটের পরিবর্তে প্রশিক্ষিত-থেকে-কারণ মডেলগুলিতে একটি অভ্যন্তরীণ ডিফল্ট আচরণ হয়ে উঠবে। দীর্ঘস্থায়ী শিক্ষা হল যে অভিনয় করার আগে একটি কাজকে পচিয়ে ফেলা একটি সস্তা, ব্যাপকভাবে স্থানান্তরযোগ্য নির্ভরযোগ্যতা লাভ।

বাস্তব-বিশ্ব বাস্তবায়ন

মাল্টি-স্টেপ গ্রেড-স্কুল ম্যাথ ওয়ার্ড সমস্যা (GSM8K) সমাধান করা যেখানে মডেলটি প্রথমে পরিমাণ তালিকাভুক্ত করে, তারপর সেগুলিকে ক্রমানুসারে গণনা করে।

কোনো ইমপ্লিমেন্টেশন কোড লেখার আগে ফাংশন এবং এজ কেস রূপরেখার জন্য কোডিং সহকারীকে গাইড করা।

প্রথমে ব্যবহারকারীর অন্তর্নিহিত লক্ষ্য শনাক্ত করার জন্য একটি গ্রাহক-সমর্থন এজেন্ট গঠন করা, তারপর রেজোলিউশন পদক্ষেপগুলি ক্রম করা।

একটি জটিল ডেটা-বিশ্লেষণের অনুরোধ ভঙ্গ করে 'কোয়েরির পরিকল্পনা করুন' এর পরে 'রান এবং ফলাফল একত্রিত করুন' পর্যায়গুলি।

বাস্তবায়ন নিদর্শন

প্ল্যান-এন্ড-সলভ প্রম্পটিং অনুশীলনে

মাল্টি-স্টেপ গ্রেড-স্কুল ম্যাথ ওয়ার্ড সমস্যা (GSM8K) সমাধান করা যেখানে মডেলটি প্রথমে পরিমাণ তালিকাভুক্ত করে, তারপর সেগুলিকে ক্রমানুসারে গণনা করে।

মাল্টি-স্টেপ গ্রেড-স্কুল ম্যাথ ওয়ার্ড সমস্যা (GSM8K) সমাধান করা যেখানে মডেলটি প্রথমে পরিমাণের তালিকা করে, তারপর সেগুলিকে ক্রমানুসারে গণনা করে দলগুলি সাধারণত ভাল ফলাফল পায় যখন তারা সামনের মানের থ্রেশহোল্ডগুলিকে সংজ্ঞায়িত করে, প্রান্তের ক্ষেত্রে একটি মানবিক বৃদ্ধির পথ রাখে এবং সময়ের সাথে সাথে উত্পাদনশীলতা লাভ এবং ত্রুটির খরচ উভয়ই ট্র্যাক করে৷

প্ল্যান-এন্ড-সলভ প্রম্পটিং অনুশীলনে

কোনো ইমপ্লিমেন্টেশন কোড লেখার আগে ফাংশন এবং এজ কেস রূপরেখার জন্য কোডিং সহকারীকে গাইড করা।

কোনো ইমপ্লিমেন্টেশন কোড লেখার আগে ফাংশন এবং এজ কেস রূপরেখা করার জন্য কোডিং অ্যাসিস্ট্যান্টকে গাইড করা দলগুলি সাধারণত ভাল ফলাফল পায় যখন তারা সামনের মানের থ্রেশহোল্ডগুলিকে সংজ্ঞায়িত করে, প্রান্ত কেসের জন্য একটি মানব বৃদ্ধির পথ রাখে এবং সময়ের সাথে সাথে উত্পাদনশীলতা লাভ এবং ত্রুটি খরচ উভয়ই ট্র্যাক করে।

প্ল্যান-এন্ড-সলভ প্রম্পটিং অনুশীলনে

প্রথমে ব্যবহারকারীর অন্তর্নিহিত লক্ষ্য শনাক্ত করার জন্য একটি গ্রাহক-সমর্থন এজেন্ট গঠন করা, তারপর রেজোলিউশন পদক্ষেপগুলি ক্রম করা।

প্রথমে ব্যবহারকারীর অন্তর্নিহিত লক্ষ্য সনাক্ত করার জন্য একটি গ্রাহক-সমর্থন এজেন্ট গঠন করা, তারপর রেজোলিউশনের ধাপগুলি ক্রমানুসারে দলগুলি সাধারণত ভাল ফলাফল পায় যখন তারা সামনের মানের থ্রেশহোল্ডগুলিকে সংজ্ঞায়িত করে, প্রান্তের ক্ষেত্রে একটি মানবিক বৃদ্ধির পথ রাখে এবং সময়ের সাথে সাথে উত্পাদনশীলতা লাভ এবং ত্রুটির খরচ উভয়ই ট্র্যাক করে৷

প্ল্যান-এন্ড-সলভ প্রম্পটিং অনুশীলনে

একটি জটিল ডেটা-বিশ্লেষণের অনুরোধ ভঙ্গ করে 'কোয়েরির পরিকল্পনা করুন' এর পরে 'রান এবং ফলাফল একত্রিত করুন' পর্যায়গুলি।

একটি জটিল ডেটা-বিশ্লেষণের অনুরোধ ভঙ্গ করে 'কোয়েরির পরিকল্পনা করুন' তারপরে 'রান এবং ফলাফল একত্রিত করুন' পর্যায়গুলি অনুসরণ করে দলগুলি সাধারণত ভাল ফলাফল পায় যখন তারা সামনের মানের থ্রেশহোল্ডগুলিকে সংজ্ঞায়িত করে, প্রান্তের ক্ষেত্রে একটি মানবিক বৃদ্ধির পথ রাখে এবং সময়ের সাথে সাথে উত্পাদনশীলতা লাভ এবং ত্রুটির খরচ উভয়ই ট্র্যাক করে।

ঝুঁকি এবং প্রহরী

!

একটি বেঞ্চমার্ক অপ্টিমাইজ করা বৃহত্তর সিস্টেম দুর্বলতা আড়াল করতে পারে।

!

অবকাঠামো এবং রক্ষণাবেক্ষণের খরচ প্রায়ই অবমূল্যায়ন করা হয়।

!

সিস্টেমগুলি আরও জটিল হওয়ার সাথে সাথে সুরক্ষা এবং পর্যবেক্ষণযোগ্যতার ফাঁক বাড়তে পারে।

বাস্তবায়ন রোডম্যাপ

1

বাস্তবায়নের আগে বিলম্ব, গুণমান এবং খরচের লক্ষ্য নির্ধারণ করুন।

বাস্তবায়নের আগে বিলম্ব, গুণমান এবং খরচের লক্ষ্য নির্ধারণ করুন। প্রতিটি পদক্ষেপকে একটি প্রমাণ গেট হিসাবে বিবেচনা করুন: যদি মানদণ্ড পূরণ না হয়, রোলআউট থামান, ব্যবধান বন্ধ করুন এবং শুধুমাত্র তারপর ব্যবহার প্রসারিত করুন।

2

বাস্তবসম্মত লোড এবং ডেটা অবস্থার অধীনে বেঞ্চমার্ক।

বাস্তবসম্মত লোড এবং ডেটা অবস্থার অধীনে বেঞ্চমার্ক। প্রতিটি পদক্ষেপকে একটি প্রমাণ গেট হিসাবে বিবেচনা করুন: যদি মানদণ্ড পূরণ না হয়, রোলআউট থামান, ব্যবধান বন্ধ করুন এবং শুধুমাত্র তারপর ব্যবহার প্রসারিত করুন।

3

ত্রুটি, প্রবাহ, এবং ব্যবহারকারীর প্রভাবের জন্য যন্ত্র পর্যবেক্ষণ।

ত্রুটি, প্রবাহ, এবং ব্যবহারকারীর প্রভাবের জন্য যন্ত্র পর্যবেক্ষণ। প্রতিটি পদক্ষেপকে একটি প্রমাণ গেট হিসাবে বিবেচনা করুন: যদি মানদণ্ড পূরণ না হয়, রোলআউট থামান, ব্যবধান বন্ধ করুন এবং শুধুমাত্র তারপর ব্যবহার প্রসারিত করুন।

4

স্কেল করার আগে রোলব্যাক এবং ঘটনার প্রতিক্রিয়া পাথ প্রস্তুত করুন।

স্কেল করার আগে রোলব্যাক এবং ঘটনার প্রতিক্রিয়া পাথ প্রস্তুত করুন। প্রতিটি পদক্ষেপকে একটি প্রমাণ গেট হিসাবে বিবেচনা করুন: যদি মানদণ্ড পূরণ না হয়, রোলআউট থামান, ব্যবধান বন্ধ করুন এবং শুধুমাত্র তারপর ব্যবহার প্রসারিত করুন।

অন্বেষণ চালিয়ে যান