
هوش مصنوعی DeepMind همچنین در برابر رباتهای برتر بازی Stratego، از جمله چندین ربات که قبلاً قهرمان مسابقات جهانی استراتژی کامپیوتری شده بودند، 97 درصد برنده شد.
درباره این موضوعات بیشتر بدانید:
هوش مصنوعی DeepMind همچنین در برابر رباتهای برتر بازی Stratego، از جمله چندین ربات که قبلاً قهرمان مسابقات جهانی استراتژی کامپیوتری شده بودند، 97 درصد برنده شد.
درباره این موضوعات بیشتر بدانید:
منبع: https://www.newscientist.com/article/2349484-deepmind-ai-uses-deception-to-beat-human-players-in-war-game-stratego/?utm_campaign=RSS%7CNSNS&utm_source=NSNS&utm_medium=RSS&utm_content=home
هوش مصنوعی توسعه یافته توسط شرکت انگلیسی DeepMind با یادگیری نحوه بلوف زدن با قطعات ضعیف تر و قربانی کردن قطعات مهم به نام پیروزی، به یکی از بهترین بازیکنان آنلاین در بازی تخته ای Stratego با موضوع ناپلئونی تبدیل شده است.
نتیجه یک هوش مصنوعی است که با وجود اطلاعات پنهان در مورد حریفان، تعداد زیادی از حالتهای احتمالی بازی و بسیاری از اقدامات ممکن مختلف که میتوان در هر نوبت انجام داد، قادر به تصمیمگیری برنده است. میگوید: «این کار جدیدی است که قبلاً نمیتوانستیم انجام دهیم جولین توگلیوس در دانشگاه نیویورک
میگوید رویکرد تئوری بازی دیپنش میتواند در موقعیتهای غیربازی که هوش مصنوعی باید با سایر بازیکنان هوشمند، مانند تجارت و دفاع مقابله کند، مفید باشد. توماس سندهولم در دانشگاه کارنگی ملون در پنسیلوانیا.
یک هوش مصنوعی در بازی تخته ای Stratego با موضوع جنگ، که شامل اطلاعات ناقص و تعداد زیادی از سناریوهای احتمالی بازی است، یاد گرفته است که حریفان انسانی را فریب دهد.
فن آوری
1 دسامبر 2022
برای ما، شگفتانگیزترین رفتار بود [the AI’s] توانایی قربانی کردن بخشهای ارزشمند برای به دست آوردن بینش در مورد چیدمان و استراتژی حریف.” جولین پرولات در DeepMind
این چالش با این واقعیت پیچیده است که Stratego یک بازی بسیار پیچیده با 10 است535 موقعیت های احتمالی بازی در مقایسه، بازی Go دارای 10 است360 حالت های احتمالی بازی شطرنج و پوکر هم کمتر دارند.
Perolat و همکارانش در DeepMind هوش مصنوعی “DeepNash” خود را برای تسخیر Stratego با انجام بیش از 5.5 میلیارد بازی با زمان آموزش شبیه سازی تقریباً معادل صدها سال توسعه دادند. اما هوش مصنوعی مانند هوش مصنوعی بازی StarCraft DeepMind بر هیچ دانشی از استراتژی های انسانی خاص بازی تکیه نکرد. او همچنین برای بازی مقابل حریفان خاصی تمرین نکرده است.
DeepNash قبلاً بر مخالفان انسان و هوش مصنوعی تسلط داشته است. او در 50 مسابقه رتبهبندی شده در برابر بازیکنان انسانی خبره از طریق یک پلتفرم بازی آنلاین به نرخ برد 84 درصدی دست یافت و به یکی از سه بازیکن برتر تبدیل شد – بدون اینکه حریفان انسانی متوجه شوند که در برابر هوش مصنوعی بازی میکنند.
بازی Stratego شامل دو بازیکن است که سعی میکنند پرچم حریف را که در میان 40 مهره بازی پنهان شده است، بگیرند. اکثر مهرهها شامل سربازانی هستند که 1-10 شمارهگذاری شدهاند، با سربازان ردهبالاتر در هنگام رویارویی روی ست، سربازان رده پایینتر را شکست میدهند. اما بازیکنان نمیتوانند هویت مهرههای بازی مقابل را ببینند مگر اینکه دو مهره از ارتشهای مقابل به هم برسند – برخلاف بازیهایی مانند شطرنج یا Go که هر دو بازیکن میتوانند همه چیز را ببینند.
هوش مصنوعی DeepNash به جای تلاش برای بازی با جستجوی تمام سناریوهای ممکن بازی، که از نظر محاسباتی غیرممکن است، الگوریتمی دارد که به طور مداوم رفتار خود را به سمت یک استراتژی بهینه که توسط تئوری بازی های اقتصادی ارائه می شود هدایت می کند. کارل تویلز در DeepMind استراتژی بهینه آن است که حداقل 50 درصد نرخ برد را در برابر یک حریف کامل تضمین کند، حتی اگر حریف دقیقاً بداند که هوش مصنوعی چه کاری را انجام می دهد.
توضیح می دهد: «بازیکنان خوب تمایل دارند مهره های حریف را به خاطر بسپارند و الگوهای استقرار آنها را پیش بینی کنند جورجیوس یاناکاکیس در دانشگاه مالت “DeepNash هر دو را به خوبی انجام می دهد – احتمالاً با یک مزیت رقابتی در مورد حافظه – و به طور جالب و غیرقابل پیش بینی بازی می کند و عناصر بلوف را به نمایش می گذارد.”
یک هوش مصنوعی میتواند بازیکنان انسانی خبره را در بازی تختهای Stratego شکست دهد که سناریوهای احتمالی بیشتری نسبت به شطرنج، Go یا پوکر دارد.
بازی تخته ای Stratego با مضمون ناپلئونی دارای تعداد زیادی حالت بازی ممکن است
راد زاده / شاتر استوک
مرجع مجله: علوم پایه، DOI: 10.1126/science.add4679