У світі штучного інтелекту (ШІ) відбулося два важливих релізи за короткий проміжок часу, які обіцяють суттєво вплинути на галузь. 18 листопада компанія Google представила нову модель Gemini 3, що стала значним кроком уперед у сфері багатогранного розуміння та графічної обробки. За інформацією аналітичних ресурсів, цей реліз підкреслив стратегічний зсув в підходах компанії до ШІ, адже вона прагне відновити лідерство на ринку.
Через шість днів свою новинку – Claude Opus 4.5 – представила компанія Anthropic, вказуючи на те, що її модель перевершила всі людські кандидатури у внутрішніх інженерних тестах. У своєму офіційному релізі компанія детально пояснила цю заяву, надаючи усі необхідні дані для обґрунтування нового успіху.
Обидві компанії також знизили витрати на експлуатацію своїх моделей після оптимізації систем. Anthropic зменшила вартість обробки тексту в Claude Opus 4.5 на 67%, скоротивши витрати з $15 до $5 за мільйон токенів. Google встановила ціну на Gemini 3 Pro на рівні $2 за сприйнятий текст і $12 за генерований, що стало можливим завдяки новій інфраструктурі TPU та оптимізаційній роботі. Це стало одною з найагресивніших стратегій цінового позиціонування серед новітніх моделей ШІ, що демонструє швидкі зміни в економіці висококласних технологій.
Порівняння моделей
Gemini 3 відзначається розвитком мультидисциплінарного інтелекту, здатного обробляти текст, графіки, зображення, відео та код в єдиному робочому потоці. Модель продемонструвала понад 90% результат на GPQA Diamond, тестуючи наукове мислення на рівні кандидатської дисертації. Аналітики вказують, що досягнення Gemini 3 в області візуального сприйняття та мультиформатного розуміння можуть радикально змінити підходи до обробки дизайн-макетів та продуктів.
Водночас Claude Opus 4.5 змістила акцент на програмування та довгострокове мислення, підвищивши ефективність виконання багатоетапних завдань. Згідно з даними, поданими у релізі, модель “відновила корону програмування”, отримавши понад 80% на тестах SWE-bench Verified, що показує її перевагу у реальних інженерних завданнях.
Обидві моделі реагують на спільні ринкові вимоги, прагнучи зробити ШІ здатним обробляти все більше робочих потоків у звичайних інструментах. Gemini акцентує своє внимание на завданнях, що вимагають візуального або просторового мислення, тоді як Opus покладається на точність і логічну послідовність.
Anthropic також інтегрувала Opus 4.5 у нові продукти, зокрема у Claude для Excel, що дозволяє проводити аналіз таблиць, генерувати графіки та працювати з кількома аркушами одночасно. Крім того, компанія представила розширення для браузера, яке дозволяє моделі працювати з кількома вкладками та агрегувати інформацію з електронних листів та внутрішніх документів.
На противагу цьому, Google інтегрувала Gemini 3 у свою ширшу екосистему, включаючи AI Mode у пошуку, додаток Gemini та інструменти Vertex AI, завдяки чому модель зайняла провідні позиції у розробці веб-інтерфейсів.
Рівень виконання на виробництві
Обидва релізи свідчать про тренд до моделей, які здатні виконувати багатоетапну роботу, замість обмеженого реагування на окремі запити. Opus 4.5 продемонстрував свою здатність інтерпретувати ситуацію та надавати рішення без детальних інструкцій. Тим часом, Gemini 3 довела свою ефективність у бізнес-симуляційних тестах, управлінні віртуальним vending-machine, де згенерувала показник активів, що вдвічі перевищує результати конкурентів, підкреслюючи важливість послідовних рішень за часом.
