Game Theory : ট্রাভেলার’স ডিলেমা

June 28, 2018 ...

পুরোটা পড়ার সময় নেই? ব্লগটি একবারে শুনে নাও!

 

আমরা আগের পর্বে অর্থনীতির ক্ষেত্রে গেইম থিওরির জন্য একটি উদাহরণ বিবেচনা করেছিলাম।

সেটি এমন ছিল যে, ওয়ালটন কোম্পানি কোনো একটা স্মার্টফোন প্রোডাক্ট থেকে মাসিক মুনাফা পায়- ৫০ কোটি টাকা। অন্যদিকে সিমফোনি কোম্পানিও সমান কনফিগারেশনের একটা স্মার্টফোন থেকে মাসিক মুনাফা পায়- ৫০ কোটি টাকা। এখন ওয়ালটন ভাবলো যে, তাদের পণ্যের দাম যদি খানিকটা কমানো যায়, তাহলে বিক্রি বেশি হবে। তখন লাভ আগের চাইতে বেশি হবে।

ধরা যাক, তখন লাভ হল, ৫৫ কোটি টাকা। এতে ওয়ালটনের বিক্রি ও লাভ বাড়লেও সিমফোনির কিন্তু বিক্রি কমবে, লাভও কমবে। কারণ, একই জিনিস বেশি দাম দিয়ে নিশ্চয়ই কেউ কিনতে চাইবে না। তাই সিমফোনিও একই ভাবে দাম কমিয়ে আনবে। তখন এই দু’টো কোম্পানি্র অ্যাবসলিউট লাভ হয়তো আগের চাইতে বাড়বে, কিন্তু রিলেটিভ লাভ বা অনুপাত আগে যা ছিল তাই থাকবে। ফলে, পুরো ব্যবস্থাটি আবার আগের অবস্থায় ফিরে যাবে। কি! এবার রহস্যটা বুঝলে তো?

এবার এসো গাণিতিকভাবে গেইম থিওরি বোঝার চেষ্টা করি। তার জন্য আগে ট্রাভেলার’স ডিলেমা নামে একটি অত্যন্ত মজার বিষয় সম্পর্কে জানতে হবে।

Traveler’s Dilemma

১৯৯৪ সালে কর্ণেল ইউনিভার্সিটির অর্থনীতির অধ্যাপক কৌশিক বসু এই অবস্থাটিকে ব্যাখ্যা করার জন্যে ‘গেম থিওরি’র একটা মজার সমস্যা প্রস্তাবনা করেন। যা ‘ট্রাভেলারস ডিলেমা’ (Travelers Dilemma) বা, ভ্রমণকারীর উভয়সঙ্কট নামে পরিচিত।

ধরা যাক, লুসি ও পিট দুইজন বিমানযাত্রী। তারা জার্মানী থেকে দেশে ফিরছেন। ঘটনাক্রমে তাদের সুটকেস হারিয়ে যায়। ধরো দুজনের সুটকেস হুবহু একইরকম দেখতে এবং তাতে সমমূল্যের জিনিস ছিল। তারা দুজনে কর্তৃপক্ষের নিকট অভিযোগ করলে এয়ারলাইন ম্যানেজার তাদেরকে বলল যে, তিনি ক্ষতিপূরণ দিতে রাজি আছেন। কিন্তু যেহেতু জিনিসগুলোর সঠিক মূল্য জানা সম্ভব ছিল না, তাই তিনি বললেন ক্ষতিপূরণ হিসেবে সর্বোচ্চ ১০০ ডলার দেয়া যাবে।

এবার তিনি একটা কৌশল অবলম্বন করলেন। তাদের দুজনকে আলাদা জায়গায় রেখে বলা হলো ক্ষতির পরিমাণের দাম লিখে ম্যানেজারকে দিতে। কিন্তু সেখানে কিছু শর্ত বেঁধে দিলেন। প্রথম শর্ত হচ্ছে দামটা ২ থেকে ১০০ ডলারের মধ্যে হতে হবে, যেহেতু তিনি আগেই বলেছেন ১০০ ডলারের বেশি ক্ষতিপূরণ কর্তৃপক্ষ দিবে না। দ্বিতীয় শর্ত হলো যদি তারা দু’জন একই দাম লিখে দেয়, তাহলে ম্যানেজার সেটাকেই প্রকৃত মূল্য বা বেইস হিসেবে ধরে নেবে এবং দুইজনকেই সেই পরিমাণ ডলার দিয়ে দেবে। যেমন: লুসি ও পিট দুইজনই যদি ৫০ ডলার লেখে, তাহলে দুইজনকেই ৫০ ডলার দিয়ে দেওয়া হবে।

dilemma, Game, Game theory, Theory, travelller's, গেইম, গেইম থিওরি, ট্রাভেলারস, ডিলেমা, থিওরি

তৃতীয় শর্ত হলো, যদি দুইজনের মধ্যে কোন একজন আরেকজনের চেয়ে কম দাম লেখে, তাহলে ম্যানেজার কম পরিমাণের ডলারটাকে আসল বা বেইস ধরবে। একইসাথে যে কম ডলারটা লিখলো তার ডলারের পরিমাণকে সত্যি ধরে সততার পুরস্কার হিসেবে তাকে দুই ডলার বেশি দিয়ে দেবে এবং যে বেশি পরিমাণ ডলার দাবি করল তাকে দুই ডলার কম দেবে। যেমন: লুসি যদি দাবি করে ৮০ ডলার এবং পিট দাবি করে ৯০ ডলার তাহলে ধরে নেয়া হবে লুসি সত্য বলছে অর্থাৎ তখন ৮০ ডলারকেই বেইস হিসেবে ধরা হবে। সততার পুরস্কারসহ লুসি পাবে (৮০+২) বা ৮২ ডলার। অপরদিকে পিট পাবে (৮০-২) বা ৭৮ ডলার।

এই হলো শর্ত। এগুলো আলাদা আলাদাভাবে বুঝিয়ে দিয়ে লুসি ও পিট-কে দুটি আলাদা আলাদা ঘরে নিয়ে যাওয়া হলো এবং বলা হলো দামটা লিখে ম্যানেজারকে দিতে। এখানে ধরে নেওয়া যাক, লুসি ও পিট দুজনই সমান ও উচ্চ মানের বোধবুদ্ধিসম্পন্ন। অর্থাৎ দু’জনেই যুক্তিসঙ্গত চিন্তা করে। এবং তারা দু’জন দুজনের বুদ্ধিমত্তা সম্পর্কেও অবগত। সেই সাথে দুজনই অধিক মুনাফা লাভের ব্যাপারে আগ্রহী।

এখন আমরা যুক্তির বিচারে তাদের দুজনের অবস্থাকে বর্ণনা করব। যে কেউ কাগজ পাওয়ার সাথে সাথেই ১০০ ডলার লিখে ফেলবে। কারণ এটাই সবচেয়ে বেশি মানের ডলার যা সে পেতে পারে। জিনিসটার দাম যদি ১০০ ডলারের কম হয় তাহলে ১০০ ডলার পেলে তো তার লাভই হয়! লুসিও তাই করলো। কিন্তু ঠিক তখনি তার মাথায় আরেকটা চিন্তা আসবে। সে তখন ভাববে, পিটও নিশ্চয়ই ১০০ ডলারই লিখবে। এর চেয়ে বরং আমি এক কাজ করি। আমি লিখে দেই ৯৯ ডলার। এতে করে সে সততার পুরস্কার হিসেবে (৯৯+২) বা ১০১ ডলার পেয়ে যাবে। ওদিকে পিট পাবে (৯৯-২) বা ৯৭ ডলার। ফলে, কৌশলগত কারণে লুসি পিটের চাইতে ৪ ডলার বেশি পাচ্ছে!

এই ভেবে সে যখনই ৯৯ ডলার লিখে ফেলবে ঠিক তখনি তার মাথায় আরেকটা ব্যাপার খেলা করবে। সে ভাববে, পিটও নিশ্চয়ই আমি যা ভাবছি তা ভাবছে (কারণ দুজনই যুক্তিসঙ্গত চিন্তা করে এবং তা উভয়েই জানে) তাহলে সেও তো ৯৯ ডলারই লিখবে! তাহলে আমি ৯৯ ডলার না লিখে বরং ৯৮ ডলার লিখি তাহলে আমি পাব (৯৮+২) বা ১০০ ডলার আর পিট পাবে (৯৮-২) ডলার বা ৯৬ ডলার! এখানেও ৪ ডলার বেশি।

এই যুক্তিকে আরো সামনে বাড়তে দিলে দেখা যায় এই ব্যাপারটা একটা সিরিজের মতো করে চলতে থাকবে কেননা লুসি মানসিকভাবে একটি যুক্তির লুপে আটকা পড়ে যাবে। আর তাই তার ডলারের পরিমাণটা ধীরে ধীরে কমতেই থাকবে! ৯৮ থেকে ৯৭, ৯৭ থেকে ৯৬, ৯৬ থেকে ৯৫- তাত্ত্বিকভাবে ডলারের পরিমাণটা কমেই যেতে থাকবে। একটা সময় কমতে কমতে এটা তাত্ত্বিকভাবে দুই ডলারে গিয়ে থামবে! যেহেতু নির্ধারিত শর্তমতে, পণ্যের মূল্য সর্বনিম্ন ছিল দুই।

অপরদিকে এই একই চিন্তাভাবনাগুলো কিন্তু পিটের মাথায়ও খেলা করতে থাকবে! কিভাবে নিজে একটু বেশি ডলার পাওয়া যায়, সেটার জন্য লুসি কম পেলে পাক!

এখানেই ‘গেইম থিওরি’র শুরু। ছোট্ট ঘটনাকে কেন্দ্র করে লুসি ও পিটের মধ্যে একটা অলিখিত প্রতিদ্বন্দ্বীতা শুরু হয়ে গেছে। অবশ্য অনেকেই বলতে পারে, দুজনেই যদি সত্যটা লিখে, তাহলে তো আর কোনো সমস্যা হয় না। কিন্তু বাস্তব জীবনে ব্যবসার ক্ষেত্রে হিসেব-নিকেশগুলো এরকমই প্রতিদ্বন্দ্বীতামূলক।

যাইহোক, লুসি এবং পিটের বিভিন্ন কৌশল ও তার ফলাফলকে আমরা বোঝার সুবিধার্তে নিচের ম্যাট্রিক্স আকারে সাজিয়ে লিখতে পারি-

Screen Shot 2018 06 28 at 20.11.40

গেম থিওরিতে এ ধরণের ম্যাট্রিক্সকে বলা হয় পে-অফ ম্যাট্রিক্স। পে-অফ ম্যাট্রিক্সটা খেয়াল করলে দেখা যাবে- এখানে লুসি এবং পিটের লেখা বিভিন্ন ডলার পরিমাণের সাপেক্ষে তাদের প্রাপ্ত ক্ষতিপূরণকে দেখানো হয়েছে।

যেমন: লুসি এবং পিট দু’জনই যদি ১০০ ডলার লেখে, আমরা জানি যে দুজনই ১০০ ডলার করে পাবে। একদম নিচে সবচেয়ে ডানের ঘরে তাই আমরা (১০০- ১০০) দেখতে পাচ্ছি। আবার ধরি, লুসি লিখল ৩ ডলার, পিট লিখল ৪ ডলার। তাহলে আমরা জানি যে ম্যানেজার ৩ ডলারকে বেস হিসেবে ধরে লুসিকে দিবে (৩+২) বা ৫ ডলার। আর পিটকে দিবে (৩-২) বা ১ ডলার। (৫- ১) লেখা ঘরটা কিন্তু তাই নির্দেশ করে।

এই পুরো ব্যাপারটা থেকে আসলে যে সিদ্ধান্তটা নেওয়া যায় তা হচ্ছে, সবসময় অসঙ্গতিপূর্ণ প্রতিদ্বন্দ্বিতা আমাদেরকে কাঙ্ক্ষিত সাফল্য দেয় না। সহযোগিতাপূর্ণ এবং নৈতিক চিন্তাভাবনা আমাদের জন্যে বেশি লাভজনক।

ন্যাশের সাম্যাবস্থা (Nash Equilibrium)

‘গেম থিওরি’র একটি গুরুত্বপূর্ণ বিষয় হচ্ছে ‘ন্যাশ সাম্যাবস্থা’। পে-অফ ম্যাট্রিক্সের একটা বিশেষ ঘরের দিকে লক্ষ্য কর। ঘরটা হচ্ছে (২-২)। মনে করে দেখি পিট এবং লুসির শেষমেশ দুইজনই ২ ডলার করে লিখেছিল। এই ঘরটার একটা বিশেষ বৈশিষ্ট্য আছে যা অন্য ঘরগুলোর নেই।

পে-অফ ম্যাট্রিক্সটা একটু ভালভাবে লক্ষ্য করলে আমরা দেখতে পাই যে, যে কোন একজন প্লেয়ারের সিদ্ধান্তকে অপরিবর্তিত রেখে যদি আরেকজন তার সিদ্ধান্ত পরিবর্তন করতে থাকে তাহলে এই (২-২) বাদে বাকি সব ঘরের জন্যই দুই প্লেয়ারের অন্তত একজন হলেও লাভবান হয় অর্থাৎ বেশি ডলার পায়। ব্যাপারটা একটু বিস্তারিতভাবে বলা যাক। (২-২) ছাড়া ম্যাট্রিক্সের যে কোনো একটা ঘর নিই।

ধরা যাক, লুসি লিখল ৩ এবং পিটও লিখল ৩। তাহলে আমরা পে-অফ ম্যাট্রিক্সের যে ঘরটায় থাকব তা হচ্ছে (৩-৩)। ধরে নিই পিট তার সিদ্ধান্ত অপরিবর্তিত রাখবে অর্থাৎ সে ৩ ই লিখবে। এখন লুসি যদি তার সিদ্ধান্তের পরিবর্তন করে তাহলে কী হয় লক্ষ্য কর:

একটু লক্ষ্য করলেই আমরা দেখতে পাব যে লুসি যদি ৩ না লিখে ২ লিখে তাহলে আমরা থাকব (৪-০) ঘরে অর্থাৎ লুসি ৪ ডলার (২+২) পাবে, যেখানে আগে সে পেত ৩ ডলার। আর পিট পাবে ০ ডলার (২-২)। আবার ধরি লুসি তার সিদ্ধান্ত পরিবর্তন করবেনা অর্থাৎ সে ৩ ই লিখবে। পিট যদি তার সিদ্ধান্তের পরিবর্তন করে ৩ না লিখে ২ লিখে তাহলে আমরা থাকব (০-৪) ঘরে অর্থাৎ পিট পাবে ৪ ডলার, যেখানে আগে সে পেত ৩ ডলার। এখান থেকে আমরা যা বুঝতে পারি (৩-৩) ঘরে থাকলে লুসি তার পাওয়া ডলারের পরিমানটাকে কিন্তু বাড়িয়ে নিতে পারবে, যদি পিট তার সিদ্ধান্তে অটল থাকে। একই কথা পিটের জন্যেও খাটবে।

কিন্তু এবার (২-২) ঘরটার কথা ভাবা যাক। আমরা যদি পে-অফ ম্যাট্রিক্সটা একটু ভালভাবে লক্ষ্য করি তাহলে দেখতে পাব, একজন প্লেয়ারের সিদ্ধান্তকে অপরিবর্তিত রেখে আরেকজন তার সিদ্ধান্ত পরিবর্তন করলে সে কখনোই লাভবান হতে পারবে না।

ব্যাপারটাকে এভাবে বলা যায় যে লুসি যদি ২ ডলার লিখে সে নিশ্চিতভাবে বলতে পারবে যে পিট যাই লিখুক না কেন কখনোই ২ ডলারের চেয়ে বেশি পাবে না আর সে নিজে অন্তত ২ ডলার পাবেই। আবার পিটও যদি ২ ডলার লিখে সে নিশ্চিতভাবে বলতে পারবে যে লুসি কখনোই ২ ডলারের চেয়ে বেশি পাবে না এবং সে নিজে অন্তত ২ ডলার পাবেই। কারণ, ২ ডলারই বেজ। ২ ডলার যে-ই লিখুক না কেন, ম্যানেজার তখন ২-কে বেজ ধরবে। তাই (২-২) ঘরেই এসে শেষমেশ তারা স্থির হবে। ফলে (২-২) ঘরটা একটা সাম্যাবস্থা নির্দেশ করবে। একেই বলা হয় Nash Equilibrium বা ‘ন্যাশের সাম্যাবস্থা’।

আগামী পর্বে ট্রাভেলার’স ডিলেমার মতো গেইম থিওরির আরও কিছু উদাহরণ তুলে ধরবো যা তোমাকে বিস্মিত করবে। পড়তে ভুলো না কিন্তু!

এই লেখাটির অডিওবুকটি পড়েছে মেহের আফরোজ শাওলী


১০ মিনিট স্কুলের লাইভ এডমিশন কোচিং ক্লাসগুলো অনুসরণ করতে সরাসরি চলে যেতে পারো এই লিঙ্কে: www.10minuteschool.com/admissions/live/

১০ মিনিট স্কুলের ব্লগের জন্য কোনো লেখা পাঠাতে চাইলে, সরাসরি তোমার লেখাটি ই-মেইল কর এই ঠিকানায়: write@10minuteschool.com

৬ষ্ঠ থেকে ১০ম শ্রেণি অনলাইন ব্যাচ ২০২৩

দেশের যেকোনো প্রান্ত থেকে ঘরে বসেই দেশসেরা শিক্ষকদের সাথে যুক্ত হও ইন্টারেক্টিভ লাইভ ক্লাসে, নাও ৬ষ্ঠ থেকে ১০ম শ্রেণির সম্পূর্ণ সিলেবাসের 💯তে💯 প্রস্তুতি!

আপনার কমেন্ট লিখুন