Компанія Deep Cogito, заснована в червні 2024 року в Сан-Франциско, привернула увагу фахівців серією гібридних моделей Cogito 1. Вони можуть перемикатися між режимами “міркування” та швидкої відповіді, що є справжньою інновацією у сфері відкритих моделей штучного інтелекту.
Модель Cogito 1
На відміну від звичайних моделей, які просто видають відповідь, Cogito 1 може міркувати перед відповіддю, що дозволяє краще вирішувати складні завдання в галузі математики, логіки й фізики. Однак якщо запит простий, то модель діє без зайвих обчислень, забезпечуючи швидкий відгук.
Такі підходи вже застосовуються іншими ШІ-лабораторіями, як-от Anthropic, однак Cogito стверджує, що їхня гібридна система перевершує більшість відкритих моделей на ринку. У тому числі продукти від Meta та китайської DeepSeek.
Наразі лінійка Cogito 1 включає моделі з 3 до 70 мільярдів параметрів, а найближчим часом очікується реліз моделей аж до 671 мільярда параметрів. Найпотужніша з уже доступних – Cogito 70B. Вона демонструє перевагу над DeepSeek R1 у тестах на математичні та мовні навички. Навіть без увімкненого режиму міркування, Cogito 70B перевершує Llama 4 Scout від Meta на загальному тесті LiveBench.
Моделі можна завантажити або використовувати через API. Вони доступні на платформах Fireworks AI та Together AI.
Попри інноваційність, Cogito 1 не створювали з нуля. Команда Deep Cogito використала відкриті моделі Llama (Meta) та Qwen (Alibaba) як основу. Після чого вдосконалила їх за власною методологією навчання, додавши унікальну можливість перемикання міркувань. На все це пішло всього 75 днів роботи невеликої команди, як зазначає компанія у своєму блозі. І це лише початок: Deep Cogito планує подальше пост-навчання моделей для самовдосконалення.