Китайська лабораторія штучного інтелекту DeepSeek оголосила про випуск відкритої моделі штучного інтелекту DeepSeek V3. Модель відзначилася високими показниками. Однак з’ясувалося, що її успіхи можуть бути не такими вже унікальними – DeepSeek V3 ідентифікує себе як ChatGPT.
Чому DeepSeek V3 ідентифікує себе з іншою моделлю
Тести показали, що DeepSeek V3, відповідаючи на запитання, заявляє, що є версією GPT-4 OpenAI. Ба більше, на запити про використання API DeepSeek модель надає інструкції щодо використання API OpenAI. Деякі з її відповідей і навіть жарти повністю збігаються з відповідями GPT-4.
Компанія DeepSeek не розкрила деталей щодо навчальних даних для DeepSeek V3. Проте існує безліч загальнодоступних наборів інформації, що містять текст, створений ChatGPT. Якщо модель справді була навчена на такій інформації, то вона могла запам’ятати її і дослівно відтворювати.
Майк Кук, науковий співробітник Королівського коледжу Лондона, зазначив, що навчання моделі на відповідях іншої системи може мати серйозні наслідки. Це як робити копію з копії. До того ж така практика може суперечити умовам використання OpenAI, які забороняють розробку конкурентних моделей на основі їхніх результатів. Відповідей від OpenAI і DeepSeek поки не надійшло, але генеральний директор стартапу OpenAI Сем Альтман про дещо натякнув у своєму пості в соціальній мережі X:
Легко копіювати те, що працює. Складно створювати нове, коли не знаєш, чи це спрацює.