BTC$29880

ETH$3666

Шукати

#ШІ

ШІ-підхід на основі прямого розповсюдження для точного налаштування моделей дифузії

Імовірнісні моделі дифузії стали стандартом для генеративного моделювання в суцільних областях, зокрема DALLE є лідером у моделях дифузії текст-зображення. Ці моделі відомі своєю здатністю генерувати зображення з великих наборів веб-даних.

Як групування характеристик людини покращує інтерпретацію нейронних мереж

У нещодавній статті під назвою "На шляху до моносемантичності: Декомпозиція мовних моделей за допомогою вивчення словників", дослідники вирішили проблему розуміння складних нейронних мереж, зокрема мовних моделей, які знаходять широке застосування в різних додатках.

Покращення узгодженості генерації тексту в 3D за допомогою вирівняних геометричних пріоритетів

Перетворення 2D-зображень на 3D-об'єкти під час перетворення текст- 3D є складним завданням. Основна перешкода виникає через те, що 2D-моделі дифузії базуються на принципах діагностики вигляду і не розуміють просторового розуміння 3D під час перетворення.

Фейкове порно вийшло з-під контролю

Google і Microsoft борються зі сплеском несанкціонованого поширення фальшивого порнографічного контенту, створеного за допомогою штучного інтелекту. Такі відео, створені штучним інтелектом, дедалі частіше використовуються для переслідування та експлуатації людей, особливо жінок, шляхом накладання їхніх облич на відвертий контент без їхньої згоди.

Як за допомогою ШІ прийняти свою внутрішню відьму та змусити мітлу літати

Mistral Trismegistus-7B — це не зовсім звична модель штучного інтелекту; це цифровий містик на базі штучного інтелекту, створений для того, щоб проводити користувачів через езотеричну, окультну та духовну сфери.

Новий підхід до тонкого налаштування мовних моделей

Дослідники з System2 Research, Кембриджського університету, Університету Монаша та Прінстонського університету досягли значних успіхів у точному налаштуванні попередньо навчених мовних моделей для створення більш ефективних мовних агентів, особливо у сфері запитально-відповідних завдань з використанням пошукового API Google.

Новий метод, який перетворює довгий контекст на дерево підсумкових даних

Впровадження архітектури трансформерів завдяки механізму самонавчання, збільшенню розміру моделі та обсягу даних для попереднього навчання значно покращило роботу з великими мовними моделями.

Дослідники мета ШІ представили розшифровку сприйняття мови з неінвазивних записів мозку

Розшифровка розмовної мови за активністю мозку — давнє прагнення в галузі охорони здоров'я та нейронаук — досягла значного прогресу завдяки використанню інвазивних пристроїв. Алгоритми глибокого навчання, навчені на внутрішньочерепних записах, продемонстрували здатність розшифровувати основні лінгвістичні елементи.

Генерування зображень у контексті з мультимодальними LLM

Останні досягнення значно покращили генерацію зображень з текстових описів і синтез нових зображень шляхом поєднання тексту і зображень. Однак з'явився новий рубіж: генерування зображень з узагальнених вхідних даних мовою технічного зору, особливо тих, що включають складні описи сцен з багатьма об'єктами і людьми.

Швидший та ефективніший метод дистиляції для перетворення тексту в зображення

Моделі дифузії текст-зображення, навчені на великих наборах даних, стали домінуючою силою в генеративних задачах, оскільки вони дають високоякісні та різноманітні результати. Останнім часом ці моделі застосовують для задач перетворення зображень, таких як зміна, покращення або надвисока роздільна здатність зображень, керуючи згенерованими результатами за допомогою дифузії.

Використання штучного інтелекту в навчанні серцево-легеневої реанімації

Серцево-легенева реанімація (CPR) — це життєво важлива медична процедура, яка застосовується у разі зупинки серця, що характеризується раптовим припиненням ефективного серцебиття або дихання.