Deep Cogito випустила нові гібридні моделі штучного інтелекту

Компанія Deep Cogito, заснована в червні 2024 року в Сан-Франциско, привернула увагу фахівців серією гібридних моделей Cogito 1. Вони можуть перемикатися між режимами “міркування” та швидкої відповіді, що є справжньою інновацією у сфері відкритих моделей штучного інтелекту.

Модель Cogito 1

На відміну від звичайних моделей, які просто видають відповідь, Cogito 1 може міркувати перед відповіддю, що дозволяє краще вирішувати складні завдання в галузі математики, логіки й фізики. Однак якщо запит простий, то модель діє без зайвих обчислень, забезпечуючи швидкий відгук.

Такі підходи вже застосовуються іншими ШІ-лабораторіями, як-от Anthropic, однак Cogito стверджує, що їхня гібридна система перевершує більшість відкритих моделей на ринку. У тому числі продукти від Meta та китайської DeepSeek.

Наразі лінійка Cogito 1 включає моделі з 3 до 70 мільярдів параметрів, а найближчим часом очікується реліз моделей аж до 671 мільярда параметрів. Найпотужніша з уже доступних – Cogito 70B. Вона демонструє перевагу над DeepSeek R1 у тестах на математичні та мовні навички. Навіть без увімкненого режиму міркування, Cogito 70B перевершує Llama 4 Scout від Meta на загальному тесті LiveBench.

Моделі можна завантажити або використовувати через API. Вони доступні на платформах Fireworks AI та Together AI.

Попри інноваційність, Cogito 1 не створювали з нуля. Команда Deep Cogito використала відкриті моделі Llama (Meta) та Qwen (Alibaba) як основу. Після чого вдосконалила їх за власною методологією навчання, додавши унікальну можливість перемикання міркувань. На все це пішло всього 75 днів роботи невеликої команди, як зазначає компанія у своєму блозі. І це лише початок: Deep Cogito планує подальше пост-навчання моделей для самовдосконалення.

Може вам сподобатись

Модель Cogito 1

Може вам сподобатись

Telegram-гаманець отримав масштабне оновлення

Anthropic прагне оцінки в $150 мільярдів під час нового раунду фінансування

Платформа Pixelfed тепер доступна для iOS і Android

Lenovo представила нову модель ігрового КПК Legion Go S

Philips використовує штучний інтелект для оновлення застарілої фототека

Bybit піднімається на друге місце серед світових криптобірж після краху FTX