#Diffusion

Сила пасльону покарає ШІ за вилучення даних без дозволу

Цей інструмент працює, тонко модифікуючи цифрові зображення, щоб забруднити набори даних, які використовуються для навчання ШІ. Ці зміни настільки тонкі, що обманюють системи штучного інтелекту, змушуючи їх неправильно інтерпретувати зображення.

24.10.2023 12:05

Модуль, який синхронізує декілька дифузій за допомогою градієнтного спуску

У нещодавній дослідницькій роботі KAIST представлено SyncDiffusion — інноваційний модуль, покликаний революціонізувати генерацію панорамних зображень за допомогою попередньо навчених моделей дифузії.

21.10.2023 16:01

Зображення надвисокої роздільної здатності з попередньо навченими моделями дифузії

Останніми роками спостерігається значний сплеск у розвитку методів синтезу зображень, що викликає інтерес як в академічних колах, так і в промисловості. Зокрема, моделі перетворення тексту в зображення та стабільна дифузія стали лідерами в цій галузі.

21.10.2023 13:13

ШІ-підхід на основі прямого розповсюдження для точного налаштування моделей дифузії

Імовірнісні моделі дифузії стали стандартом для генеративного моделювання в суцільних областях, зокрема DALLE є лідером у моделях дифузії текст-зображення. Ці моделі відомі своєю здатністю генерувати зображення з великих наборів веб-даних.

17.10.2023 16:09

Покращення узгодженості генерації тексту в 3D за допомогою вирівняних геометричних пріоритетів

Перетворення 2D-зображень на 3D-об'єкти під час перетворення текст- 3D є складним завданням. Основна перешкода виникає через те, що 2D-моделі дифузії базуються на принципах діагностики вигляду і не розуміють просторового розуміння 3D під час перетворення.

17.10.2023 14:16

Генерування зображень у контексті з мультимодальними LLM

Останні досягнення значно покращили генерацію зображень з текстових описів і синтез нових зображень шляхом поєднання тексту і зображень. Однак з'явився новий рубіж: генерування зображень з узагальнених вхідних даних мовою технічного зору, особливо тих, що включають складні описи сцен з багатьма об'єктами і людьми.

12.10.2023 19:53

Швидший та ефективніший метод дистиляції для перетворення тексту в зображення

Моделі дифузії текст-зображення, навчені на великих наборах даних, стали домінуючою силою в генеративних задачах, оскільки вони дають високоякісні та різноманітні результати. Останнім часом ці моделі застосовують для задач перетворення зображень, таких як зміна, покращення або надвисока роздільна здатність зображень, керуючи згенерованими результатами за допомогою дифузії.

12.10.2023 14:06

Salesforce AI запускає GlueGen

У сфері моделей перетворення тексту в зображення (T2I), що стрімко розвивається, GlueGen представляє новий підхід для підвищення гнучкості та функціональності цих моделей. Моделі T2I продемонстрували вражаючі можливості у створенні зображень з текстових описів, але вони були обмежені з точки зору модифікації та розширення.

05.10.2023 12:24

Нове велике оновлення DALL-E 3

OpenAI, впливовий гравець у галузі генеративного ШІ, представив DALL-E 3, останню версію свого генератора зображень. Ця оновлена ітерація в поєднанні з контролером ChatGPT здатна створювати високоякісні зображення у відповідь на підказки природною мовою. Варто зазначити, що OpenAI також вжив заходів для забезпечення етичного контролю.

21.09.2023 13:18

Дослідники Salesforce представили XGen-Image-1

Поєднання штучного інтелекту та створення візуального контенту відкрило неабиякі можливості у сферах маркетингу, продажів та електронної комерції. Це поєднання знаменує собою значний прогрес, формуючи нову еру цифрової комунікації та трансформуючи способи взаємодії бізнесу зі своєю аудиторією.

14.08.2023 12:30

Курси

Bitcoin

$18739

BTC

+3.68%

Etherium

$739

ETH

+3.68%

Etherium

$739

ETH

+3.68%

Etherium

$739

ETH

+3.68%

Etherium

$739

ETH

+3.68%

Etherium

$739

ETH

+3.68%

Etherium

$739

ETH

+3.68%

Теги

Приеднуйся