Компанія OpenAI в вівторок представила два нові моделі відкритого ваги, прагнучи конкурувати з Meta і DeepSeek. Проте ці моделі є лише частково відкритими: розробники не отримують код джерела або дані для навчання.
Нові моделі gpt-oss від OpenAI мають два розміри: 120 мільярдів і 20 мільярдів параметрів, що представляють собою статистичні зв’язки, засвоєні моделлю під час навчання. В загальному, чим більше параметрів, тим потужнішою є модель.
«Ми вважаємо, що це найкраща і найбільш зручна відкрита модель у світі», — зазначив генеральний директор OpenAI Сем Альтман.
Останній раз OpenAI випустила відкриту модель у 2019 році, що сталося з GPT-2. Але GPT-2 була повністю відкритою, що робило її справді відкритим програмним забезпеченням, хоча цей процес тривав кілька місяців. OpenAI не уточнила, чи стане gpt-oss зрештою відкритим програмним забезпеченням також.
Модель gpt-oss є текстовою моделлю з відкритими вагами, що означає, що користувач може використовувати та налаштовувати модель, але не знає, як вона була навчена або на яких даних.
Без знання даних, на базі яких була створена модель, компанії не отримують повної прозорості, що може підвищити ризики в таких сферах, як фінансові послуги, охорона здоров’я та інші структури з високим рівнем регуляції.
Наприклад, компанія в сфері охорони здоров’я може захотіти повністю перевірити процес навчання моделі перед її використанням на персональних даних пацієнтів.
«Якщо доступні лише відкриті ваги, розробники не мають можливості значно оцінити упередження, обмеження та соціальні наслідки», — повідомляє Інститут інженерії запитів та штучного інтелекту.
Однак OpenAI надає доступ під ліцензією Apache 2.0, яка надає користувачеві «вічні, світові, неексклюзивні, безкоштовні, без роялті, незворотні авторські права» на створення і розповсюдження моделі.
«Ці відкриті моделі також знижують бар’єри для нових ринків, секторів з обмеженими ресурсами та менших організацій, які можуть не мати бюджету чи гнучкості для впровадження патентованих моделей», — підкреслили в OpenAI.
Користувачі можуть завантажити GPT-OSS на Hugging Face або переглянути на GitHub.
Читати далі: OpenAI додає 200 мільйонів нових користувачів щотижня за 4 місяці.
Гонка відкритих AI моделей
Основними конкурентами за домінування у сфері відкритого коду є Meta з флагманською моделлю Llama, але з обмеженнями на використання та розподіл; французька компанія Mistral AI; а також китайські постачальники, такі як DeepSeek та Alibaba, з більшістю своїх моделей Qwen.
Альтман назвав gpt-oss «великою подією» з «сильними реальними показниками», порівнянними з o4-mini. (Серія o, або omni, складається з моделей аргументації OpenAI — це нова сім’я моделей після серії GPT.)
Наприклад, у стандарті MMLU, що тестує, як добре LLM справляються з широким спектром академічних та професійних завдань, gpt-oss показує результати, які не сильно відрізняються від OpenAI o3 та o4-mini.
OpenAI зазначила, що модель gpt-oss з 120 мільярдами параметрів може працювати на комп’ютері користувача, а менша модель може працювати на смартфоні. Зазвичай великі моделі AI працюють у хмарі.
Хоча випуск відкритої моделі означає, що недобросовісні особи можуть використовувати її в поганих цілях, Альтман зазначив, що компанія вважає, що «набагато більше добрих, ніж поганих» наслідків буде з цього.
Це відрізняється від 2019 року, коли OpenAI випустила GPT-2 поетапно, остерігаючись, що його можуть використовувати не за призначенням.
Інші моделі OpenAI залишаються закритими і патентованими. Її конкуренти випустили різні ступені відкритих моделей: Google має моделі з відкритими вагою, але не є відкритими за ліцензією, такі як Gemma. Anthropic не має відкритої моделі. Microsoft відкрила свої моделі Phi. Моделі Amazon є патентованими.
Читати далі:
Команда AI Apple працює над конкуренцією для ChatGPT.
OpenAI залучила нове фінансування для досягнення оцінки 300 мільярдів доларів.
Microsoft прагне розширити доступ до технологій OpenAI.