BTC$29880

ETH$3666

Шукати

#Звук

ElevenLabs розширює можливості штучного інтелекту, випускаючи інструмент для створення звукових ефектів до відео

ElevenLabs, стартап, що займається розробкою голосового штучного інтелекту, робить черговий крок вперед у сфері створення контенту, випускаючи інструмент з відкритим кодом для автоматичного додавання звукових ефектів до відео.

ElevenLabs впроваджує штучний інтелект для створення звукових ефектів

ElevenLabs, новий стартап у сфері штучного інтелекту, заснований колишніми співробітниками Google і Palantir, знову здіймає хвилю в світі штучного інтелекту, оголосивши про свою останню нову модель перетворення тексту в звук.

Підхід глибокого навчання, розроблений для створення реалістичних пташиних пісень для біологів та екологів

Розвиток глибокого навчання справив глибокий вплив на різні сфери, і одним з інтригуючих застосувань є його роль у моніторингу рідкісних птахів за їхніми піснями

Salesforce AI запускає GlueGen

У сфері моделей перетворення тексту в зображення (T2I), що стрімко розвивається, GlueGen представляє новий підхід для підвищення гнучкості та функціональності цих моделей. Моделі T2I продемонстрували вражаючі можливості у створенні зображень з текстових описів, але вони були обмежені з точки зору модифікації та розширення.

ШІ-фреймворк для створення композиційного аудіо з великими мовними моделями

Нова галузь мультимодального штучного інтелекту (ШІ) поєднує візуальні, слухові та текстові дані, пропонуючи потенційні застосування в різних сферах — від персоналізованих розваг до покращення доступності. Природна мова відіграє ключову роль у покращенні розуміння та комунікації в різних сенсорних сферах.