Генеративна модель Imagen 4 від компанії Google вийшла з оновленими можливостями рендерингу тексту й точнішого виконання інструкцій. Розробники стверджують, що нова версія значно перевершує Imagen 3.
Що відомо про Imagen 4
Користувачі можуть випробувати Imagen 4 у платному доступі через Gemini API (по $0,04 за зображення) або обмежено протестувати у Google AI Studio. А для тих, хто прагне максимальної відповідності текстовим запитам, доступна преміальна версія Imagen 4 Ultra з ціною $0,06 за картинку.
Ілюстрації, створені Ultra-версією, справді демонструють поліпшену структурну відповідність. Наприклад, на запит про вітальну листівку з Кіото, модель згенерувала картинку з сакурою та кіотським замком. Візуально вона вийшла досконалою – ніяких зайвих предметів та штрихів. Однак з огляду на естетику та емоційний підтекст, зображення можна охарактеризувати, як холодне та порожнє.
Google, як і завжди, тримається академічної та інженерної досконалості. У той час як конкуренти на кшталт DALL-E 3 чи Midjourney 7 зосереджуються на естетиці й “людських” штрихах, Imagen 4 поки що виглядає як досконалий, але байдужий інструмент.
Ба більше, на тлі загальної втоми користувачів від арту, створеного штучним інтелектом, комерційне майбутнє таких моделей бачиться прозаїчним. Їх найчастіше використовуватимуть для генерації рекламних зображень або банерів на кшталт “15 фактів про печінку” під клікбейтними статтями.