05.12.2023 16:40
Технологічний гігант Alibaba може «анімувати кого завгодно»
Минули часи незграбних Flash-анімацій та електронних відкриток JibJab. Сьогодні кожен, хто має комп’ютер і трохи вільного часу, може створювати анімацію професійної якості, як для реальних людей, так і для ілюстрацій, лише кількома клацаннями миші і без попереднього досвіду редагування.
Це обіцяє «Animate Anyone» — революційна модель штучного інтелекту, розроблена дослідницькою групою Alibaba. Їхня технологія, продемонстрована у вірусному відео, стверджує, що може анімувати будь-яку фотографію з надзвичайною точністю і контролем, захоплюючи уяву мільйонів.
За даними MyCompanions, стартапу AI-аватарів, “Animate Anyone” може перетворювати фотографії на відео, “дотримуючись бажаної послідовності поз і досягаючи безперервного руху в часі”. Це означає плавний, послідовний рух з мінімальними збоями, що відкриває можливості для захоплюючих додатків, таких як моделювання одягу та створення персоналізованих відео для впливових осіб.
Переважна кількість людей, які відгукнулися на проект, завалила сторінку моделі на Github запитами на доступ до вихідного коду. У відповідь команда підтвердила свою готовність випустити як демонстраційну версію, так і код, але не вказала дату.
Якщо відео-демонстрації точні, Animate Anyone може створювати напрочуд реалістичні анімації, зберігаючи при цьому зовнішній вигляд еталонного персонажа. Це досягається завдяки новому фреймворку під назвою ReferenceNet, який використовує дифузійні моделі для інтеграції детальних характеристик за допомогою просторової уваги.
По суті, модель бере еталонне зображення, маніпулює ним відповідно до бажаних поз і плавно заповнює вільні фрагменти, створюючи ілюзію послідовного руху через відеокадри. Ця техніка “відкритої послідовності” призводить до майже бездоганної анімації.
Хоча Animate Anyone привернув до себе значну увагу, схожа модель під назвою MagicAnimate також стає сильним конкурентом. Цей інструмент фокусується на покращенні часової послідовності та збереженні ідентичності, що призводить до більш плавних переходів і кращого збереження деталей у довгих відеоанімаціях.
Однак, хоча MagicAnimate перевершує інші інструменти в плані темпоральної узгодженості, його точність здається дещо нижчою, ніж у Animate Anyone. Алекс Карлієра, колишній дослідник Meta AI, похвалив MagicAnimate як “чудовий перший крок”, але також відзначив неточності в деформаціях тіла в деяких кадрах порівняно з еталонним зображенням.
Отже, і Animate Anyone, і MagicAnimate є значним кроком вперед у технології анімації на основі штучного інтелекту. Ці інструменти демократизують створення анімації, дозволяючи будь-кому втілювати свої ідеї в життя з приголомшливим реалізмом. З подальшим розвитком і вдосконаленням ця технологія може зробити революцію в різних галузях – від розваг і маркетингу до освіти та охорони здоров’я.