Керівники бізнесу, які оцінюють рішення у сфері штучного інтелекту (ШІ), повинні обережно ставитися до припущення, що великі загальні моделі, як-от ChatGPT від OpenAI, завжди матимуть кращі результати, ніж спеціалізовані моделі. Про це йдеться у аналізі, опублікованому цього тижня.
Великі мовні моделі, такі як ChatGPT, Claude та Gemini, демонструють хороші результати у загальних задачах, що вимагають отримання інформації з різноманітних джерел, наприклад, у сферах обслуговування клієнтів. Проте вони не є такими ж ефективними, як моделі ШІ, адаптовані до специфіки окремих галузей при виконанні завдань, які вимогливі до знань у даній області.
Це може здаватися очевидним, але має практичні наслідки. З таким висновком погоджуються автори звіту, серед яких Амбер Нігам, засновниця стартапу Basys.ai, та Джон Глейзер, виконавчий директор Гарвардської медичної школи та колишній CEO Siemens Health Services.
Автори створили генеративні системи ШІ для медичних страхових компаній, щоб визначити, чи покриває страховий поліс рекомендоване лікарем лікування. Вони виявили, що вибір правильної моделі генеративного ШІ є ключовим для досягнення оптимальних бізнес-результатів.
Важливе розуміння між загальними та спеціалізованими моделями полягає в тому, що спеціалізовані моделі не тільки знають, які дані потрібно отримати, а також розуміють, як ця інформація працює у межах прийняття рішень в рамках конкретної області.
Наприклад, спеціалізована модель ШІ, що вирішує, чи повинні медичні страхові компанії схвалювати покриття для лікування пацієнта з раком легенів, повинна враховувати, чи відшкодовується хіміотерапія відповідно до умов поліса.
Крім того, вона має взяти до уваги медичний стан пацієнта, наприклад, термінальну ниркову недостатність та недавню госпіталізацію, що можуть вплинути на лікування або рішення щодо покриття. Загальна модель ШІ, яка вирішує ту ж задачу, шукатиме історичні дані про те, як схвалювался покриття в інших випадках з подібними симптомами. Проте «цей підхід, заснований на виявленні шаблонів, може не враховувати клінічну та політичну логіку, що лежить в основі ухвалення рішень, особливо у складніших випадках», зазначили вони.
Розуміння специфіки
Експерти прийшли до важливого усвідомлення: «Чому ми намагаємося змусити ШІ мислити як комп’ютер, якщо йому потрібно мислити, як лікар?»
Тому автори навчили своїх агентів генеративного ШІ «слідкувати за тим, як лікарі читають — розуміючи структуру таблиць, переходячи від розділів до підрозділів та визначаючи правильні факти в контексті». Це розуміння допоможе й іншим підприємствам правильно обирати моделі ШІ для застосування у разі потреби, незалежно від галузі.
За даними аналітичного звіту, бізнес-лідери адаптують системи генеративного ШІ до своїх стратегічних потреб. У галузі товарів та технологій використання генеративного ШІ для розробки продуктів і генерації ідей є поширеним. Натомість компанії послуг застосовують генеративний ШІ для більш специфічних цілей, таких як формування кращого стратегічного позиціонування або швидше отримання інсайтів.
Крім того, хоча більшість опитаних керівників визнали, що генеративний ШІ ефективно виконує конкретні завдання, вони вказали на необхідність «всеосяжного» людського нагляду. Це означає, що «ентузіазм може свідчити про те, як швидко користувачі почали знаходити генеративний ШІ корисним у конкретних випадках, а не про те, наскільки вони вважають цю технологію готовою в цілому», згідно зі звітом.
Таке розмежування між очікуваннями та реальністю підкреслює важливість вибору правильної моделі ШІ для виконання конкретних завдань. Автори радять компаніям розглядати такі питання до постачальників ШІ, щоб уникнути розповсюджених помилок:
- Чи може система пояснити свої міркування прозоро? Загальні моделі ШІ часто надають поверхневі або неясні відповіді; спеціалізовані системи повинні демонструвати, як вони використовують критерії при ухваленні рішень та посилатися на стандарти або прецеденти.
- Чи спілкується постачальник безпосередньо з фахівцями в галузі та адаптується до змінюваних норм? Тісна співпраця забезпечує вбудовування еволюціонуючих професійних стандартів, а не застарілих наборів правил.
- Чи має рішення можливість масштабування по галузях? Уникайте ситуацій з ізольованими рішеннями, обираючи архітектури, які інтегрують професійну логіку та можуть розширюватися на нові сфери, такі як фінанси, право чи інженерія.
Додатково:
Моделі ШІ набувають зрілості з фокусом на налаштування.
Звіт: Моделі ШІ не завжди працюють, коли проблеми стають занадто складними.
Microsoft планує оцінювати моделі ШІ за рівнем безпеки.