BTC$29880

ETH$3666

Шукати

#MetaAI

Meta представила дві нові моделі штучного інтелекту для створення відео та редагування зображень

Компанія Meta, що займається соціальними мережами, представила дві нові моделі штучного інтелекту для створення відео та редагування зображень. Одна модель, Emu Video, здатна генерувати відеокліпи на основі введеного тексту та зображень. Друга модель, Emu Edit, дозволяє користувачам редагувати зображення більш точно, ніж раніше.

Дослідники мета ШІ представили розшифровку сприйняття мови з неінвазивних записів мозку

Розшифровка розмовної мови за активністю мозку — давнє прагнення в галузі охорони здоров'я та нейронаук — досягла значного прогресу завдяки використанню інвазивних пристроїв. Алгоритми глибокого навчання, навчені на внутрішньочерепних записах, продемонстрували здатність розшифровувати основні лінгвістичні елементи.

Nougat від Meta AI: візуальний трансформер для наукового розпізнавання текстів

Зі стрімким розвитком штучного інтелекту такі підгалузі, як обробка природної мови, генерація природної мови та комп'ютерний зір, набули величезної популярності завдяки широкому спектру застосувань. Серед них оптичне розпізнавання символів (Optical Character Recognition, OCR) є добре відпрацьованою і широко дослідженою галуззю комп'ютерного зору.

MC-JEPA: Прогностична архітектура для самокерованого вивчення рухів

Останнім часом у самоконтрольованому навчанні зору домінують методи, що зосереджуються на вивченні особливостей контенту — зокрема тих, що дозволяють нам ідентифікувати та розрізняти об'єкти. Більшість методик зосереджені на визначенні широких характеристик, які добре працюють у таких завданнях, як категоризація предметів або виявлення активності у фільмах.