Китайська компанія DeepSeek нещодавно презентувала нову версію своєї моделі штучного інтелекту R1, яка демонструє високі результати у вирішенні математичних задач та програмуванні. Однак почали з’являтися припущення, що для її навчання могли бути використані дані з моделей Gemini від Google.
DeepSeek знову під підозрою
Розробник Сем Паеч із Мельбурна звернув увагу, що модель R1-0528 використовує ті самі вирази, які переважають у відповідях Google Gemini 2.5 Pro. Інший дослідник, автор проєкту SpeechMap, зазначив, що мислення моделі DeepSeek мають схожий на Gemini спосіб формування логічних висновків.
Це не перший випадок, коли DeepSeek підозрюють у використанні чужих моделей. У грудні 2024 року модель DeepSeek V3 помилково ідентифікувала себе як ChatGPT, що викликало сумніви щодо її навчального матеріалу. OpenAI навіть повідомила, що виявила ознаки дистиляції – методу, коли одна модель навчається на відповідях іншої.
Джерела Bloomberg повідомляють, що Microsoft, партнер OpenAI, виявила масове вивантаження даних через розробницькі облікові записи, які, ймовірно, пов’язані з DeepSeek. Така практика порушує правила використання OpenAI, зокрема, заборону використовувати її продукти для створення конкурентних моделей.
Водночас експерти, як-от Натан Ламберт з AI2, вважають, що DeepSeek могла навмисно генерувати синтетичні дані через API провідних моделей, аби пришвидшити розвиток власного ШІ. У компанії є кошти, але бракує обчислювальних потужностей, що робить таку стратегію цілком вірогідною.