الذكاء الاصطناعي يتعلم قواعد الدبلوماسية
دخل الذكاء الاصطناعي لعبة الدبلوماسية، بعد أن قامت شركة ديب مايند التكنولوجية بتدريب أنظمة الذكاء الاصطناعي على لعبة "دبلوماسي"، وهي لعبة استراتيجية لوحية تحتاج لمزيج من التعاون والمنافسة من أجل الفوز، بحسب موقع سبيكترام.
ويبدو أن الدبلوماسية أعقد كثيرا من لعب الشطرنج: تعد اللعبة هي المرحلة التالية في تفوق تكنولوجيا الذكاء الاصطناعي، التي جرى تطويرها للفوز بألعاب مثل الشطرنج ولعبة "جو" اللوحية الصينية. والآن يمكن لبرامج تعتمد على الذكاء الاصطناعي أن تفوز بـ "دبلوماسي" التي تضم 7 لاعبين يقومون بتحركاتهم في نفس الوقت، وهو ما شكل "مسألة كيفية مختلفة"، بحسب عالم الكمبيوتر بشركة ديب مايند أندريا تاشيتي. وتتضمن اللعبة الأصلية مفاوضات شفهية بين اللاعبين، قامت ديب مايند بمنع الاتصالات بينهم في نسختها "نو برس".
وطورت شركة ديب مايند نموذج "ديب نت" الذي استخدم بيانات ألعاب 150 ألف إنسان بشري من خلال خوارزمية مطورة للتعليم المعزز. وبدلا من استخدام التعليم المعزز فقط، والذي يتطلب الذكاء الاصطناعي للقيام بعدد من التحركات السخيفة في كل دور، قام المطورون بحساب الخطوة الأفضل في المتوسط مقابل التحرك الأرجح من قبل الخصم، وتدريب الذكاء الاصطناعي على تفضيل تلك التحركات، لاستخدام ما تعلمه دون التجربة بعد التدريب.
ويعد برنامج "ألفا جو" الذي طوره ديب مايند هو أول عقل اصطناعي يفوز على بطل عالمي بشري للعبة "جو" عام 2016، والذي تناوله فيلم وثائقي بنفس الاسم (شاهد 1:30:27 ساعة). ومنذ ذلك الحين طورت ديب مايند برنامج ألفا زيرو الأكثر تقدما، والذي يمكنه لعب الشطرنج وأيضا لعبة شوجي، كما طورت "موزيرو" والذي يتعلم الألعاب دون التعرف على القواعد ويمكنه أيضا المشاركة في ألعاب الأتاري الأكثر تعقيدا. وفازت تكنولوجيا الذكاء الاصطناعي على البشر في الشطرنج منذ الثمانينات من القرن الماضي، ومن أبرز تلك الهزائم خسارة بطل الشطرنج العالمي جاري كاسباروف عام 1997 على "يد" كمبيوتر ديب بلو الذي طورته شركة آي بي إم.
وستقوم فيسبوك بتقديم نموذجها الخاص من لعبة "نو برس دبلوماسي" خلال أبريل المقبل. واستخدمت فيسبوك شبكة محاكاة للبشر مشابهة لديب نيت، ولكن زودت الذكاء الاصطناعي بإمكانية بحث بدلا من التعليم المعزز، تتيح للروبوت تقليد التصرف البشري بشكل أكثر دقة. ويستغرق نموذج الاصطناعي المسمى "سيرش بوت" وقتا للتخطيط وإيجاد الطريقة الأمثل لحساب خطوات كل خصم من خلال توقع 50 تحركا محتملا. ويؤدي ذلك لبطء روبوت البحث أثناء اللعبة ولكنه يؤهله لتحقيق المزيد من الانتصارات.
وأظهرت اللعبة تفوق ديب مايند على ديب نت، فتفوق برنامج ديب مايند للذكاء الاصطناعي على 6 من برامج ديب نت في 30% من المرات مقارنة بديب نت الذي فاز 3% من المرات عند عكس الأدوار. كما أظهر سيرش بوت تفوقه على ديب مايند كما فاز على ديب نت بفارق أكبر. وجاء سيرش بوت بين أفضل 2% من اللاعبين وبينهم بشر على موقع لعبة "دبلوماسي"، ليفوز بـ 94% من المرات عند المشاركة في مجموعة من 35 لعبة ضد أفضل لاعبين بشريين لـ "دبلوماسي". ومن المقرر أن نشهد قريبا مباراة المواجهة بين سيرش بوت وديب مايند.
وعلى الرغم من أنه من المثير تعلم الذكاء الاصطناعي الألعاب التشاركية، إلا أنه يشكل تحديا في عالم الواقع. فالألعاب التي تحتاج تشاركا وليست مجرد منافسة تشبه مواقف الحياة الواقعية، والتي تطلب حساب العديد من العوامل قبل اتخاذ القرارات، بحسب ما يقول مطوري ديب مايند. ويتضمن تطوير بوت الذكاء الاصطناعي عدة متغيرات، ورسم السيناريوهات المحتملة وإيجاد استراتيجية قد تؤثر على السياسة والصحة والحوكمة وغيرها.