10.04.2024 14:12
Google Imagen 2 тепер може створювати чотирисекундні анімовані зображення
Google запустив оновлення для свого сімейства моделей генерації зображень, зосередившись, зокрема, на Imagen 2. Компанія оголосила, що Imagen 2 відтепер матиме функцію перетворення тексту в життя, що дозволить користувачам перетворювати текстові підказки на анімовані зображення. Крім того, модель штучного інтелекту тепер підтримує різні функції редагування зображень, такі як домальовування, розмальовування та нанесення цифрових водяних знаків.
Представлена на конференції Google Cloud Next, функція Imagen 2 для перетворення тексту в реальному часі генерує анімовані GIF-файли спочатку зі швидкістю 24 кадри на секунду, з роздільною здатністю 360×640 пікселів і тривалістю чотири секунди. Google підкреслює, що планується постійне вдосконалення цієї функції.
Генеральний директор Google Cloud Томас Куріан підкреслив важливість технології text-to-live, особливо для організацій, що працюють у сфері медіа та реклами, оскільки вона підвищує залученість користувачів, представляючи короткі анімовані послідовності замість статичних зображень.
Imagen 2 може похвалитися можливістю створювати зображення з різними кутами нахилу камери та рухами, зберігаючи при цьому цілісність усієї послідовності. Він також включає фільтри безпеки та цифрові водяні знаки, що розв’язують проблеми, пов’язані з використанням генеративного штучного інтелекту.
Нові функції редагування зображень в Imagen 2 дозволяють користувачам додавати або видаляти елементи з фотографій, подібно до функцій Adobe Photoshop, що враховують вміст. Крім того, користувачі можуть розширювати межі зображення, щоб надати йому ширший вигляд.
Ці оновлення є частиною ширших анонсів Google щодо Vertex AI, повністю керованої хмарної платформи штучного інтелекту.
Запущений у 2023 році, Imagen 2 є продуктом Google DeepMind і призначений для створення фотореалістичних зображень високої роздільної здатності на основі підказок природною мовою. Вона конкурує з подібними платформами, такими як DALL-E, Midjourney та Adobe Firefly, задовольняючи потреби підприємств у зображеннях, які відповідають корпоративним принципам та вимогам до управління.