میگوید رویکرد تئوری بازی دیپنش میتواند در موقعیتهای غیربازی که هوش مصنوعی باید با سایر بازیکنان هوشمند، مانند تجارت و دفاع مقابله کند، مفید باشد. توماس سندهولم در دانشگاه کارنگی ملون در پنسیلوانیا.
برای ما، شگفتانگیزترین رفتار بود [the AI’s] توانایی قربانی کردن بخشهای ارزشمند برای به دست آوردن بینش در مورد چیدمان و استراتژی حریف.” جولین پرولات در DeepMind
یک هوش مصنوعی میتواند بازیکنان انسانی خبره را در بازی تختهای Stratego شکست دهد که سناریوهای احتمالی بیشتری نسبت به شطرنج، Go یا پوکر دارد.
هوش مصنوعی توسعه یافته توسط شرکت انگلیسی DeepMind با یادگیری نحوه بلوف زدن با قطعات ضعیف تر و قربانی کردن قطعات مهم به نام پیروزی، به یکی از بهترین بازیکنان آنلاین در بازی تخته ای Stratego با موضوع ناپلئونی تبدیل شده است.
نتیجه یک هوش مصنوعی است که با وجود اطلاعات پنهان در مورد حریفان، تعداد زیادی از حالتهای احتمالی بازی و بسیاری از اقدامات ممکن مختلف که میتوان در هر نوبت انجام داد، قادر به تصمیمگیری برنده است. میگوید: «این کار جدیدی است که قبلاً نمیتوانستیم انجام دهیم جولین توگلیوس در دانشگاه نیویورک
این چالش با این واقعیت پیچیده است که Stratego یک بازی بسیار پیچیده با 10 است535 موقعیت های احتمالی بازی در مقایسه، بازی Go دارای 10 است360 حالت های احتمالی بازی شطرنج و پوکر هم کمتر دارند.
توضیح می دهد: «بازیکنان خوب تمایل دارند مهره های حریف را به خاطر بسپارند و الگوهای استقرار آنها را پیش بینی کنند جورجیوس یاناکاکیس در دانشگاه مالت “DeepNash هر دو را به خوبی انجام می دهد – احتمالاً با یک مزیت رقابتی در مورد حافظه – و به طور جالب و غیرقابل پیش بینی بازی می کند و عناصر بلوف را به نمایش می گذارد.”
بازی Stratego شامل دو بازیکن است که سعی میکنند پرچم حریف را که در میان 40 مهره بازی پنهان شده است، بگیرند. اکثر مهرهها شامل سربازانی هستند که 1-10 شمارهگذاری شدهاند، با سربازان ردهبالاتر در هنگام رویارویی روی ست، سربازان رده پایینتر را شکست میدهند. اما بازیکنان نمیتوانند هویت مهرههای بازی مقابل را ببینند مگر اینکه دو مهره از ارتشهای مقابل به هم برسند – برخلاف بازیهایی مانند شطرنج یا Go که هر دو بازیکن میتوانند همه چیز را ببینند.
DeepNash قبلاً بر مخالفان انسان و هوش مصنوعی تسلط داشته است. او در 50 مسابقه رتبهبندی شده در برابر بازیکنان انسانی خبره از طریق یک پلتفرم بازی آنلاین به نرخ برد 84 درصدی دست یافت و به یکی از سه بازیکن برتر تبدیل شد – بدون اینکه حریفان انسانی متوجه شوند که در برابر هوش مصنوعی بازی میکنند.
مرجع مجله: علوم پایه، DOI: 10.1126/science.add4679
Perolat و همکارانش در DeepMind هوش مصنوعی “DeepNash” خود را برای تسخیر Stratego با انجام بیش از 5.5 میلیارد بازی با زمان آموزش شبیه سازی تقریباً معادل صدها سال توسعه دادند. اما هوش مصنوعی مانند هوش مصنوعی بازی StarCraft DeepMind بر هیچ دانشی از استراتژی های انسانی خاص بازی تکیه نکرد. او همچنین برای بازی مقابل حریفان خاصی تمرین نکرده است.
یک هوش مصنوعی در بازی تخته ای Stratego با موضوع جنگ، که شامل اطلاعات ناقص و تعداد زیادی از سناریوهای احتمالی بازی است، یاد گرفته است که حریفان انسانی را فریب دهد.
فن آوری
1 دسامبر 2022
هوش مصنوعی DeepNash به جای تلاش برای بازی با جستجوی تمام سناریوهای ممکن بازی، که از نظر محاسباتی غیرممکن است، الگوریتمی دارد که به طور مداوم رفتار خود را به سمت یک استراتژی بهینه که توسط تئوری بازی های اقتصادی ارائه می شود هدایت می کند. کارل تویلز در DeepMind استراتژی بهینه آن است که حداقل 50 درصد نرخ برد را در برابر یک حریف کامل تضمین کند، حتی اگر حریف دقیقاً بداند که هوش مصنوعی چه کاری را انجام می دهد.
منبع: https://www.newscientist.com/article/2349484-deepmind-ai-uses-deception-to-beat-human-players-in-war-game-stratego/?utm_campaign=RSS%7CNSNS&utm_source=NSNS&utm_medium=RSS&utm_content=home
راد زاده / شاتر استوک