OpenAI Конкурує з Rivals Meta та DeepSeek, пропонуючи дві нові моделі

Компанія OpenAI в вівторок представила два нові моделі відкритого ваги, прагнучи конкурувати з Meta і DeepSeek. Проте ці моделі є лише частково відкритими: розробники не отримують код джерела або дані для навчання.

Нові моделі gpt-oss від OpenAI мають два розміри: 120 мільярдів і 20 мільярдів параметрів, що представляють собою статистичні зв’язки, засвоєні моделлю під час навчання. В загальному, чим більше параметрів, тим потужнішою є модель.

«Ми вважаємо, що це найкраща і найбільш зручна відкрита модель у світі», – зазначив генеральний директор OpenAI Сем Альтман.

Останній раз OpenAI випустила відкриту модель у 2019 році, що сталося з GPT-2. Але GPT-2 була повністю відкритою, що робило її справді відкритим програмним забезпеченням, хоча цей процес тривав кілька місяців. OpenAI не уточнила, чи стане gpt-oss зрештою відкритим програмним забезпеченням також.

Модель gpt-oss є текстовою моделлю з відкритими вагами, що означає, що користувач може використовувати та налаштовувати модель, але не знає, як вона була навчена або на яких даних.

Прозорість, ліцензія та ризики застосування

Без знання даних, на базі яких була створена модель, компанії не отримують повної прозорості, що може підвищити ризики в таких сферах, як фінансові послуги, охорона здоров’я та інші структури з високим рівнем регуляції.

Наприклад, компанія в сфері охорони здоров’я може захотіти повністю перевірити процес навчання моделі перед її використанням на персональних даних пацієнтів.

«Якщо доступні лише відкриті ваги, розробники не мають можливості значно оцінити упередження, обмеження та соціальні наслідки», – повідомляє Інститут інженерії запитів та штучного інтелекту.

Однак OpenAI надає доступ під ліцензією Apache 2.0, яка надає користувачеві «вічні, світові, неексклюзивні, безкоштовні, без роялті, незворотні авторські права» на створення і розповсюдження моделі.

«Ці відкриті моделі також знижують бар’єри для нових ринків, секторів з обмеженими ресурсами та менших організацій, які можуть не мати бюджету чи гнучкості для впровадження патентованих моделей», – підкреслили в OpenAI.

Користувачі можуть завантажити GPT-OSS на Hugging Face або переглянути на GitHub.

Конкуренція та позиціонування в гонці відкритих моделей

Основними конкурентами за домінування у сфері відкритого коду є Meta з флагманською моделлю Llama, але з обмеженнями на використання та розподіл; французька компанія Mistral AI; а також китайські постачальники, такі як DeepSeek та Alibaba, з більшістю своїх моделей Qwen.

Альтман назвав gpt-oss «великою подією» з «сильними реальними показниками», порівнянними з o4-mini. (Серія o, або omni, складається з моделей аргументації OpenAI – це нова сім’я моделей після серії GPT.)

Наприклад, у стандарті MMLU, що тестує, як добре LLM справляються з широким спектром академічних та професійних завдань, gpt-oss показує результати, які не сильно відрізняються від OpenAI o3 та o4-mini.

OpenAI зазначила, що модель gpt-oss з 120 мільярдами параметрів може працювати на комп’ютері користувача, а менша модель може працювати на смартфоні. Зазвичай великі моделі AI працюють у хмарі.

Хоча випуск відкритої моделі означає, що недобросовісні особи можуть використовувати її в поганих цілях, Альтман зазначив, що компанія вважає, що «набагато більше добрих, ніж поганих» наслідків буде з цього.

Це відрізняється від 2019 року, коли OpenAI випустила GPT-2 поетапно, остерігаючись, що його можуть використовувати не за призначенням.

Інші моделі OpenAI залишаються закритими і патентованими. Її конкуренти випустили різні ступені відкритих моделей: Google має моделі з відкритими вагою, але не є відкритими за ліцензією, такі як Gemma. Anthropic не має відкритої моделі. Microsoft відкрила свої моделі Phi. Моделі Amazon є патентованими.

Прозорість, ліцензія та ризики застосування

Конкуренція та позиціонування в гонці відкритих моделей

Може вам сподобатись

Автономні мікромагазини: як штучний інтелект революціонізує роздрібну торгівлю та знижує витрати

Чому бренди викладають величезні кошти в ШІ

AWS: Платежі на основі штучного інтелекту – це не майбутнє, а реальність сьогодення

Delta заявляє, що штучний інтелект прискорює аналіз ринку для визначення цін на авиаквитки

WorkWhile переосмислює погодинну працю за допомогою платформи з штучним інтелектом

Медицина очікує на докази, перед тим як штучний інтелект підкорить галузь