04.04.2024 16:22

Stability AI запускає Stable Audio 2

Компанія Stability AI, відома у сфері розробки штучного інтелекту з відкритим вихідним кодом, випустила Stable Audio 2, останню версію свого генератора аудіо та музики. Це оновлення стало помітним успіхом, адже воно містить низку вдосконалень, які посилюють конкуренцію між такими гравцями індустрії, як Suno, Google та Meta.

Stable Audio 2 створений для відтворення високоякісних повноцінних треків з цілісною музичною структурою тривалістю до трьох хвилин у стерео з частотою 44,1 кГц, і все це за допомогою єдиної підказки природною мовою. Це досягнення є свідченням прихильності Stability AI до розширення меж творчості та доступності за допомогою штучного інтелекту.

Introducing Stable Audio 2.0 – a new model capable of producing high-quality, full tracks with coherent musical structure up to three minutes long at 44.1 kHz stereo from a single prompt.

Explore the model and start creating for free at: https://t.co/E9ZIGagmPf

Read the… pic.twitter.com/rFGb0KpdeX
— Stability AI (@StabilityAI) April 3, 2024

Впровадження Stable Audio 2 відбувається у вирішальний момент для Stability AI після нещодавніх викликів, таких як фінансові обмеження і відставка генерального директора Емада Мостака. Попри ці перешкоди, компанія залишається непохитною у своїй відданості впровадженню інновацій у сфері ШІ з відкритим вихідним кодом, про що свідчить безперервний потік передових релізів, таких як Stable Code Instruct 3B і Stable Video Diffusion.

Одним з ключових досягнень Stable Audio 2 є використання технології дифузійного трансформера (DiT), що є відходом від архітектури U-Net, яка використовувалася раніше. Технологія дифузійного трансформера чудово перетворює випадковий шум на структуровані дані, що робить її ідеальною для обробки довгих послідовностей даних — критично важливою здатністю для створення повноцінних музичних треків.

Ще однією помітною особливістю Stable Audio 2 є додавання функції генерування аудіо до аудіо, яка дозволяє користувачам трансформувати завантажені звукові зразки, використовуючи підказки природною мовою. Ця функціональність розширює універсальність інструменту, пропонуючи митцям та музикантам більшу гнучкість у роботі й контроль над творчим процесом.

Попри ці досягнення, Stable Audio 2 стикається з жорсткою конкуренцією з боку Suno 3, провідного гравця у сфері створення музики за допомогою штучного інтелекту. Інтеграція Suno 3 з великими мовними моделями для генерації текстів у поєднанні зі здатністю створювати більш складні та структуровані аудіокомпозиції дає йому значну перевагу над Stable Audio 2.

За якістю вихідного звуку Suno 3 перевершує Stable Audio 2, забезпечуючи більш складні та цілісні музичні треки з більш плавними переходами між різними частинами пісні. Крім того, Suno 3 може похвалитися вищою швидкістю генерації звуку, що підвищує продуктивність для користувачів, яким потрібні швидкі результати.

Втім, Stable Audio 2 зберігає свої позиції завдяки унікальній функції генерації аудіо до аудіо, пропонуючи користувачам рівень контролю та кастомізації, якого немає в Suno 3. Ця можливість може суттєво вплинути на тих, хто прагне безперешкодно втілювати свої музичні ідеї в життя.

На закінчення, Stable Audio 2 від Stability AI демонструє видатні досягнення у створенні музики за допомогою ШІ, навіть в умовах конкуренції, де домінують такі потужні гравці, як Suno 3. І хоча Stable Audio 2 перевершує своїх конкурентів у певних сферах, таких як перетворення аудіо в аудіо, йому ще належить нарощувати й вдосконалювати свої можливості, щоб відповідати рівню досконалості, що пропонують його конкуренти. Оскільки сфера створення музики зі штучним інтелектом продовжує розвиватися, користувачі можуть очікувати на подальші інновації та вдосконалення, які розмивають межі між людською творчістю та штучним інтелектом.