هوش مصنوعی DeepMind از فریب برای شکست دادن بازیکنان انسانی در بازی Stratego استفاده می کند

می‌گوید رویکرد تئوری بازی دیپ‌نش می‌تواند در موقعیت‌های غیربازی که هوش مصنوعی باید با سایر بازیکنان هوشمند، مانند تجارت و دفاع مقابله کند، مفید باشد. توماس سندهولم در دانشگاه کارنگی ملون در پنسیلوانیا.

برای ما، شگفت‌انگیزترین رفتار بود [the AI’s] توانایی قربانی کردن بخش‌های ارزشمند برای به دست آوردن بینش در مورد چیدمان و استراتژی حریف.” جولین پرولات در DeepMind

راد زاده / شاتر استوک

نمایی از راه اندازی بازی تخته ای Stratego — Perolat و همکارانش در DeepMind هوش مصنوعی “DeepNash” خود را برای تسخیر Stratego با انجام بیش از 5.5 میلیارد بازی با زمان آموزش شبیه سازی تقریباً معادل صدها سال توسعه دادند. اما هوش مصنوعی مانند هوش مصنوعی بازی StarCraft DeepMind بر هیچ دانشی از استراتژی های انسانی خاص بازی تکیه نکرد. او همچنین برای بازی مقابل حریفان خاصی تمرین نکرده است.

بازی Stratego شامل دو بازیکن است که سعی می‌کنند پرچم حریف را که در میان 40 مهره بازی پنهان شده است، بگیرند. اکثر مهره‌ها شامل سربازانی هستند که 1-10 شماره‌گذاری شده‌اند، با سربازان رده‌بالاتر در هنگام رویارویی روی ست، سربازان رده پایین‌تر را شکست می‌دهند. اما بازیکنان نمی‌توانند هویت مهره‌های بازی مقابل را ببینند مگر اینکه دو مهره از ارتش‌های مقابل به هم برسند – برخلاف بازی‌هایی مانند شطرنج یا Go که هر دو بازیکن می‌توانند همه چیز را ببینند.

هوش مصنوعی DeepMind همچنین در برابر ربات‌های برتر بازی Stratego، از جمله چندین ربات که قبلاً قهرمان مسابقات جهانی استراتژی کامپیوتری شده بودند، 97 درصد برنده شد.

درباره این موضوعات بیشتر بدانید:

منبع: https://www.newscientist.com/article/2349484-deepmind-ai-uses-deception-to-beat-human-players-in-war-game-stratego/?utm_campaign=RSS%7CNSNS&utm_source=NSNS&utm_medium=RSS&utm_content=homeهوش مصنوعی توسعه یافته توسط شرکت انگلیسی DeepMind با یادگیری نحوه بلوف زدن با قطعات ضعیف تر و قربانی کردن قطعات مهم به نام پیروزی، به یکی از بهترین بازیکنان آنلاین در بازی تخته ای Stratego با موضوع ناپلئونی تبدیل شده است.

این چالش با این واقعیت پیچیده است که Stratego یک بازی بسیار پیچیده با 10 است⁵³⁵ موقعیت های احتمالی بازی در مقایسه، بازی Go دارای 10 است³⁶⁰ حالت های احتمالی بازی شطرنج و پوکر هم کمتر دارند.

نتیجه یک هوش مصنوعی است که با وجود اطلاعات پنهان در مورد حریفان، تعداد زیادی از حالت‌های احتمالی بازی و بسیاری از اقدامات ممکن مختلف که می‌توان در هر نوبت انجام داد، قادر به تصمیم‌گیری برنده است. می‌گوید: «این کار جدیدی است که قبلاً نمی‌توانستیم انجام دهیم جولین توگلیوس در دانشگاه نیویورک

DeepNash قبلاً بر مخالفان انسان و هوش مصنوعی تسلط داشته است. او در 50 مسابقه رتبه‌بندی شده در برابر بازیکنان انسانی خبره از طریق یک پلتفرم بازی آنلاین به نرخ برد 84 درصدی دست یافت و به یکی از سه بازیکن برتر تبدیل شد – بدون اینکه حریفان انسانی متوجه شوند که در برابر هوش مصنوعی بازی می‌کنند.

توضیح می دهد: «بازیکنان خوب تمایل دارند مهره های حریف را به خاطر بسپارند و الگوهای استقرار آنها را پیش بینی کنند جورجیوس یاناکاکیس در دانشگاه مالت “DeepNash هر دو را به خوبی انجام می دهد – احتمالاً با یک مزیت رقابتی در مورد حافظه – و به طور جالب و غیرقابل پیش بینی بازی می کند و عناصر بلوف را به نمایش می گذارد.”

یک هوش مصنوعی در بازی تخته ای Stratego با موضوع جنگ، که شامل اطلاعات ناقص و تعداد زیادی از سناریوهای احتمالی بازی است، یاد گرفته است که حریفان انسانی را فریب دهد.

فن آوری

1 دسامبر 2022

توسط احمد گل کار