Microsoft Research спільно з Університетом Аризони презентувала новаторську платформу під назвою Magentic Marketplace, призначену для дослідження поведінки агентів штучного інтелекту у віртуальному середовищі. Ця симуляційна платформа дозволяє фахівцям вивчати, як різні ШІ-моделі взаємодіють в умовах конкуренції та співпраці, відкриваючи нові горизонти для розуміння їхніх можливостей.
У рамках дослідження команда провела низку експериментів, в яких сотні агентів виконували завдання на цифровому торговому майданчику. Клієнтські агенти, які намагалися замовити різні товари, змагалися з корпоративними агентами, які боролися за вигоду у договірних угодах. Дослідники надали вихідний код Magentic Marketplace, що дозволяє іншим науковим групам повторити та розвинути ці експерименти.
Керівник AI Frontiers Lab у Microsoft Research, Едже Камар, зазначив, що результати симуляцій обнадіюють, проте породжують нові питання щодо автономності агентів. За його словами, важливим аспектом є те, чи можуть автономні системи взаємодіяти та досягати згоди без участі людини.
Вивчення показало, що сучасні ШІ-моделі, такі як GPT-4o, GPT-5 і Gemini 2.5 Flash, мають суттєві вразливості. Агенти виявилися легко піддатливими до маніпуляцій, і їхня продуктивність significantly падала з ростом кількості виборів, стаючи жертвою когнітивного перевантаження.
Крім того, в спільній роботі моделі стикалися з труднощами у розподілі ролей, що ще раз свідчить про їхню залежність від чітких інструкцій. Зокрема, навіть за наявності детальних покрокових вказівок продуктивність залишалася обмеженою, вказуючи на труднощі в самостійному ухваленні рішень.
Камар наголосив на важливості цих висновків, які підкреслюють дистанцію між реальними можливостями ШІ та їх піком автономії. Незважаючи на прогрес у генеративних моделях, до досягнення повністю автономного штучного інтелекту, що може ефективно взаємодіяти у складних середовищах, ще далеко. Дослідження в цієї галузі продовжуються, спонукаючи наукову спільноту до глибшого аналізу й удосконалення сучасних технологій ШІ.
