هوش مصنوعی DeepMind از فریب برای شکست دادن بازیکنان انسانی در بازی Stratego استفاده می کند

می‌گوید رویکرد تئوری بازی دیپ‌نش می‌تواند در موقعیت‌های غیربازی که هوش مصنوعی باید با سایر بازیکنان هوشمند، مانند تجارت و دفاع مقابله کند، مفید باشد. توماس سندهولم در دانشگاه کارنگی ملون در پنسیلوانیا.

برای ما، شگفت‌انگیزترین رفتار بود [the AI’s] توانایی قربانی کردن بخش‌های ارزشمند برای به دست آوردن بینش در مورد چیدمان و استراتژی حریف.” جولین پرولات در DeepMind

راد زاده / شاتر استوک

نمایی از راه اندازی بازی تخته ای Stratego

Perolat و همکارانش در DeepMind هوش مصنوعی “DeepNash” خود را برای تسخیر Stratego با انجام بیش از 5.5 میلیارد بازی با زمان آموزش شبیه سازی تقریباً معادل صدها سال توسعه دادند. اما هوش مصنوعی مانند هوش مصنوعی بازی StarCraft DeepMind بر هیچ دانشی از استراتژی های انسانی خاص بازی تکیه نکرد. او همچنین برای بازی مقابل حریفان خاصی تمرین نکرده است.

بازی Stratego شامل دو بازیکن است که سعی می‌کنند پرچم حریف را که در میان 40 مهره بازی پنهان شده است، بگیرند. اکثر مهره‌ها شامل سربازانی هستند که 1-10 شماره‌گذاری شده‌اند، با سربازان رده‌بالاتر در هنگام رویارویی روی ست، سربازان رده پایین‌تر را شکست می‌دهند. اما بازیکنان نمی‌توانند هویت مهره‌های بازی مقابل را ببینند مگر اینکه دو مهره از ارتش‌های مقابل به هم برسند – برخلاف بازی‌هایی مانند شطرنج یا Go که هر دو بازیکن می‌توانند همه چیز را ببینند.

هوش مصنوعی DeepMind همچنین در برابر ربات‌های برتر بازی Stratego، از جمله چندین ربات که قبلاً قهرمان مسابقات جهانی استراتژی کامپیوتری شده بودند، 97 درصد برنده شد.

درباره این موضوعات بیشتر بدانید:


منبع: https://www.newscientist.com/article/2349484-deepmind-ai-uses-deception-to-beat-human-players-in-war-game-stratego/?utm_campaign=RSS%7CNSNS&utm_source=NSNS&utm_medium=RSS&utm_content=homeهوش مصنوعی توسعه یافته توسط شرکت انگلیسی DeepMind با یادگیری نحوه بلوف زدن با قطعات ضعیف تر و قربانی کردن قطعات مهم به نام پیروزی، به یکی از بهترین بازیکنان آنلاین در بازی تخته ای Stratego با موضوع ناپلئونی تبدیل شده است.

این چالش با این واقعیت پیچیده است که Stratego یک بازی بسیار پیچیده با 10 است535 موقعیت های احتمالی بازی در مقایسه، بازی Go دارای 10 است360 حالت های احتمالی بازی شطرنج و پوکر هم کمتر دارند.

نتیجه یک هوش مصنوعی است که با وجود اطلاعات پنهان در مورد حریفان، تعداد زیادی از حالت‌های احتمالی بازی و بسیاری از اقدامات ممکن مختلف که می‌توان در هر نوبت انجام داد، قادر به تصمیم‌گیری برنده است. می‌گوید: «این کار جدیدی است که قبلاً نمی‌توانستیم انجام دهیم جولین توگلیوس در دانشگاه نیویورک

DeepNash قبلاً بر مخالفان انسان و هوش مصنوعی تسلط داشته است. او در 50 مسابقه رتبه‌بندی شده در برابر بازیکنان انسانی خبره از طریق یک پلتفرم بازی آنلاین به نرخ برد 84 درصدی دست یافت و به یکی از سه بازیکن برتر تبدیل شد – بدون اینکه حریفان انسانی متوجه شوند که در برابر هوش مصنوعی بازی می‌کنند.

توضیح می دهد: «بازیکنان خوب تمایل دارند مهره های حریف را به خاطر بسپارند و الگوهای استقرار آنها را پیش بینی کنند جورجیوس یاناکاکیس در دانشگاه مالت “DeepNash هر دو را به خوبی انجام می دهد – احتمالاً با یک مزیت رقابتی در مورد حافظه – و به طور جالب و غیرقابل پیش بینی بازی می کند و عناصر بلوف را به نمایش می گذارد.”

یک هوش مصنوعی در بازی تخته ای Stratego با موضوع جنگ، که شامل اطلاعات ناقص و تعداد زیادی از سناریوهای احتمالی بازی است، یاد گرفته است که حریفان انسانی را فریب دهد.

فن آوری


1 دسامبر 2022

یک هوش مصنوعی می‌تواند بازیکنان انسانی خبره را در بازی تخته‌ای Stratego شکست دهد که سناریوهای احتمالی بیشتری نسبت به شطرنج، Go یا پوکر دارد.

مرجع مجله: علوم پایه، DOI: 10.1126/science.add4679

بازی تخته ای Stratego با مضمون ناپلئونی دارای تعداد زیادی حالت بازی ممکن است

هوش مصنوعی DeepNash به جای تلاش برای بازی با جستجوی تمام سناریوهای ممکن بازی، که از نظر محاسباتی غیرممکن است، الگوریتمی دارد که به طور مداوم رفتار خود را به سمت یک استراتژی بهینه که توسط تئوری بازی های اقتصادی ارائه می شود هدایت می کند. کارل تویلز در DeepMind استراتژی بهینه آن است که حداقل 50 درصد نرخ برد را در برابر یک حریف کامل تضمین کند، حتی اگر حریف دقیقاً بداند که هوش مصنوعی چه کاری را انجام می دهد.

توسط احمد گل کار

احمد گل کار