পিছিয়ে আবেশন কি?
সীমাবদ্ধ বিস্তৃত রূপ এবং অনুক্রমিক গেমগুলি সমাধান করতে এবং অনুকূল কর্মের ক্রম নির্ধারণ করার জন্য গেম তত্ত্বে পশ্চাদপদ আনয়ন একটি সমস্যা বা পরিস্থিতির শেষে থেকে পিছনে যুক্তির পুনরাবৃত্তি প্রক্রিয়া।
পিছনের ইন্ডাকশন ব্যাখ্যা
1944 সালে যখন জন ভন নিউম্যান এবং ওসকার মরগেনস্টন তাদের থিওরি অফ গেমস এবং অর্থনৈতিক আচরণের বইটি প্রকাশ করেছিলেন তখন গেমস সমাধানের জন্য পশ্চাদপদ আনয়ন ব্যবহৃত হয়েছিল game
গেমের প্রতিটি পর্যায়ে পশ্চাদপদ আবেশন খেলোয়াড়ের সর্বোত্তম কৌশল নির্ধারণ করে যারা গেমটিতে সর্বশেষ পদক্ষেপ নেয়। তারপরে, পরের থেকে শেষের চলন্ত প্লেয়ারের সর্বোত্তম ক্রিয়াটি নির্ধারিত হয়, দেওয়া হিসাবে শেষ প্লেয়ারের ক্রিয়া গ্রহণ করে। সময় অনুযায়ী প্রতিটি পয়েন্টের জন্য সর্বোত্তম ক্রিয়া নির্ধারিত না হওয়া পর্যন্ত এই প্রক্রিয়াটি পশ্চাতে অব্যাহত থাকে। কার্যকরভাবে, একজন আসল গেমের প্রতিটি সাবগামের ন্যাশ ভারসাম্য নির্ধারণ করছে।
যাইহোক, পশ্চাদপদ অন্তর্ভুক্তি থেকে প্রাপ্ত ফলাফলগুলি প্রায়শই প্রকৃত মানবিক খেলার পূর্বাভাস দিতে ব্যর্থ হয়। পরীক্ষামূলক গবেষণায় দেখা গেছে যে "যৌক্তিক" আচরণ (গেম তত্ত্ব দ্বারা ভবিষ্যদ্বাণী করা) বাস্তব জীবনে খুব কমই প্রদর্শিত হয়। সেন্টিপি গেমটিতে চিত্রিত হিসাবে অযৌক্তিক খেলোয়াড়েরা পশ্চাদপসরণ দ্বারা পূর্বাভাস অনুসারে উচ্চতর বেতন আদায় করতে পারে।
সেন্টিপি গেমটিতে দুই খেলোয়াড় পর্যায়ক্রমে বাড়তি পাত্রের বৃহত্তর অংশ নেওয়ার বা অন্য প্লেয়ারের কাছে পাত্রটি দেওয়ার সুযোগ পান। পেওফগুলি এমনভাবে সাজানো হয়েছে যাতে পাত্রটি যদি কোনও প্রতিপক্ষের কাছে পৌঁছে যায় এবং প্রতিপক্ষ পরের রাউন্ডে পাত্রটি গ্রহণ করে, কেউ এই রাউন্ডে পাত্রটি নিয়েছিল তার চেয়ে কিছুটা কম প্রাপ্তি ঘটে। কোনও খেলোয়াড় স্ট্যাশ নেওয়ার সাথে সাথে গেমটি সমাপ্ত হয়, সেই খেলোয়াড়ের সাথে আরও বড় অংশ এবং অন্য খেলোয়াড়টি ছোট অংশ পাবে।
পশ্চাদপদ আনয়ন উদাহরণ
উদাহরণস্বরূপ, ধরে নিন প্লেয়ার এ প্রথমে যায় এবং সিদ্ধান্ত নিতে হয় তাকে স্ট্যাশকে "নেওয়া" বা "পাস" করা উচিত কিনা, যা বর্তমানে $ 2 এর সমান। যদি সে নেয়, তবে এ এবং বি প্রত্যেকে $ ১ পাবে, তবে যদি এ পাস হয়, তবে এখনই নেওয়া বা পাসের সিদ্ধান্ত প্লেয়ার বি দ্বারা নিতে হবে বি যদি গ্রহণ করে তবে সে $ 3 পাবে (অর্থাত্, পূর্ববর্তী স্ট্যাশ $ 2 + $ 1) এবং এ 0 ডলার পায়। তবে বি পাস হলে, এ এখন নেওয়া বা পাস করার সিদ্ধান্ত নিয়েছে এবং আরও অনেক কিছু। যদি উভয় খেলোয়াড় সর্বদা উত্তীর্ণ হতে পছন্দ করে তবে তারা প্রতিটি খেলার শেষে at 100 ডলার প্রদান করে।
গেমের মূল বিষয়টি হ'ল যদি এ এবং বি উভয় সহযোগিতা করে এবং গেমের শেষ অবধি শেষ হতে থাকে, তবে তারা সর্বোচ্চ $ ১০০ ডলার প্রদান করে। তবে যদি তারা অন্য খেলোয়াড়কে অবিশ্বাস করে এবং প্রথম সুযোগে তাদের "গ্রহণ" করার প্রত্যাশা করে, ন্যাশ ভারসাম্যহীন ভবিষ্যদ্বাণী করে খেলোয়াড়রা সবচেয়ে কম সম্ভাব্য দাবী গ্রহণ করবে (এক্ষেত্রে 1 ডলার)।
এই গেমের ন্যাশ ভারসাম্য, যেখানে কোনও খেলোয়াড় প্রতিপক্ষের পছন্দ বিবেচনা করার পরে তার নির্বাচিত কৌশল থেকে সরে আসার উত্সাহ দেয় না, প্রস্তাব দেয় প্রথম খেলোয়াড় গেমের প্রথম রাউন্ডে পাত্রটি গ্রহণ করবে। তবে বাস্তবে তুলনামূলকভাবে খুব কম খেলোয়াড়ই তা করে। ফলস্বরূপ, তারা ভারসাম্য বিশ্লেষণ দ্বারা পূর্বাভাস পরিশোধের চেয়ে উচ্চতর বেতন পায়।
পশ্চাদপদ আবেশন ব্যবহার করে সিক্যুয়ালিয়াল গেমগুলি সমাধান করা
নীচে দুটি খেলোয়াড়ের মধ্যে একটি সাধারণ ক্রমিক ক্রিয়াকলাপ। এর মধ্যে প্লেয়ার 1 এবং প্লেয়ার 2 সহ লেবেলগুলি যথাক্রমে এক বা দুজন খেলোয়াড়ের জন্য তথ্য সেট। গাছের নীচে বন্ধনীর সংখ্যাগুলি প্রতিটি নিজ নিজ বিন্দুতে প্রদত্ত বেতন। খেলাটিও ক্রমযুক্ত, সুতরাং প্লেয়ার 1 প্রথম সিদ্ধান্ত নেয় (বাম বা ডান) এবং প্লেয়ার 2 প্লেয়ার 1 এর পরে তার সিদ্ধান্ত নেয় (উপরে বা নীচে)।
চিত্র 1
সমস্ত গেম তত্ত্বের মতো পশ্চাদপদ আবেশনও যৌক্তিকতা এবং সর্বাধিকীকরণের অনুমানগুলি ব্যবহার করে যার অর্থ প্লেয়ার 2 প্রদত্ত যে কোনও পরিস্থিতিতে তার পরিশোধকে সর্বোচ্চ করবে ize উভয় তথ্য সেটে আমাদের দুটি পছন্দ আছে, সব মিলিয়ে চারটি। খেলোয়াড় 2 টি পছন্দ না করে এমন পছন্দগুলি বাদ দিয়ে আমরা আমাদের গাছকে সংকুচিত করতে পারি। এইভাবে, আমরা প্রদত্ত তথ্য সেটটিতে প্লেয়ারের পরিশোধকে সর্বাধিকীকরণকারী লাইনগুলিকে বোল্ড করব।
চিত্র ২
এই হ্রাসের পরে, প্লেয়ার 1 প্লেয়ার 2 এর পছন্দগুলি জানা হয়ে যাওয়ার পরে এখন তার সর্বোচ্চ পরিমাণ বাড়িয়ে তুলতে পারে। ফলটি প্লেয়ার 1 "ডান" এবং প্লেয়ার 2 বেছে নেওয়া "আপ" বেছে নেওয়ার পিছনে অন্তর্ভুক্তির দ্বারা পাওয়া একটি ভারসাম্য is নীচে ভারসাম্যপূর্ণ ভারসাম্যপূর্ণ পাথের সাথে গেমটির সমাধান।
চিত্র 3
উদাহরণস্বরূপ, খেলোয়াড় হিসাবে সংস্থাগুলি ব্যবহার করে উপরের খেলোয়াড়ের অনুরূপ একটি খেলা সহজেই সেট আপ করা যায়। এই গেমটিতে পণ্য প্রকাশের দৃশ্য অন্তর্ভুক্ত থাকতে পারে। যদি সংস্থা 1 কোনও পণ্য প্রকাশ করতে চায়, তবে কোম্পানি 2 এর প্রতিক্রিয়াতে কী করবে? সংস্থা 2 কি অনুরূপ প্রতিযোগিতামূলক পণ্য প্রকাশ করবে? বিভিন্ন পরিস্থিতিতে এই নতুন পণ্যটির বিক্রয় পূর্বাভাস দিয়ে আমরা কীভাবে ঘটনাগুলি উদ্ঘাটিত হতে পারে তা অনুমান করার জন্য একটি গেম সেট করতে পারি। নীচে কীভাবে কেউ এই জাতীয় খেলাকে মডেল করতে পারে তার উদাহরণ is
চিত্র 4
