15.05.2024 16:59

Google представляє Imagen 3

Google готується представити Imagen 3, оновлену модель перетворення тексту в зображення, яка обіцяє неперевершений рівень деталізації, покращене розуміння природної мови та розширені можливості рендерингу тексту. Наразі Imagen 3 знаходиться на етапі приватного попереднього ознайомлення в ImageFX для обраних авторів, а для розробників, які бажають отримати доступ до неї, створено список очікування. У найближчому майбутньому модель також планується долучити до Vertex AI.

Дуглас Ек, старший науковий директор Google DeepMind, підкреслив досягнення Imagen 3 під час конференції для розробників Google I/O. Він описав її як найздібнішу модель генерації зображень на сьогодні, яка може похвалитися підвищеним фотореалізмом, більш насиченими деталями та меншою кількістю візуальних артефактів або спотворень. Imagen 3 чудово інтерпретує підказки природною мовою, особливо ті, які є креативними та деталізованими, безперешкодно включаючи дрібні деталі навіть у довгі підказки. Крім того, він являє собою значний стрибок у відтворенні тексту, що було проблемою для попередніх моделей генерації зображень.

*Приклад зображення, зробленого за допомогою Imagen 3. Джерело*

Це оголошення слідує за загальною доступністю Imagen 2 через систему Vertex AI пів року тому, з урахуванням нещодавніх доповнень, таких як можливість перетворення тексту в реальному часі, яка була представлена у квітні. Постійні інновації Google у галузі ШІ необхідні для збереження конкурентної переваги над такими конкурентами, як DALL-E від OpenAI, Midjourney, Firefly від Adobe, AI від Meta, Designer від Microsoft та іншими, кожен з яких має свої інструменти для створення зображень.

Презентація Imagen 3 доповнює шквал оголошень з Google I/O, включаючи запуск Veo, нової моделі генерації відео, що демонструє невпинне прагнення компанії до інновацій у сфері технологій, керованих штучним інтелектом.