BTC$29880

ETH$3666

Шукати

Nvidia випустила потужне сімейство моделей ШІ NVLM 1.0 з відкритим вихідним кодом

Nvidia випустила нове сімейство моделей штучного інтелекту з відкритим вихідним кодом NVLM 1.0, яке кидає виклик пропрієтарним системам від таких гігантів індустрії, як OpenAI та Google. Найпотужніша модель цього сімейства, NVLM-D-72B, може похвалитися 72 мільярдами параметрів і демонструє виняткову продуктивність як у візуальних, так і в текстових завданнях.

NVLM 1.0 вирізняється своєю універсальністю. Модель NVLM-D-72B демонструє відмінні результати в інтерпретації зображень, інтернет-мемів та вирішенні складних завдань, водночас збільшуючи свої можливості в роботі з текстом. Після мультимодального навчання NVLM-D-72B показав середній приріст у 4,3 бала за ключовими тестами на розуміння тексту, що робить його потужним засобом вирішення завдань, пов’язаних як із зором, так і з мовою.

Результати бенчмарку, в якому модель NVIDIA NVLM-D порівнюється з такими гігантами ШІ, як GPT-4, Claude 3.5 і Llama 3-V, демонструють конкурентну продуктивність NVLM-D в різних візуальних і мовних завданнях. Джерело

Рішення Nvidia зробити ваги моделі та навчальний код загальнодоступними підкреслює важливість цієї технології в галузі, де багато передових систем залишаються закритими. Розповсюджуючи цю технологію, Nvidia відкриває двері для дослідників і розробників, надаючи доступ до інструментів, які конкурують з пропрієтарними моделями, такими як GPT-4. Цей крок розглядається як значна подія в середовищі ШІ, що дає змогу невеликим організаціям та незалежним дослідникам зробити свій внесок у розвиток технологій штучного інтелекту, де раніше домінували великі корпорації.

Нова модель ШІ від NVIDIA аналізує мем, який порівнює академічні реферати з повними статтями, демонструючи свою здатність інтерпретувати візуальний гумор і наукові концепції. Джерело

Дослідники ШІ високо оцінили цей реліз, деякі з них відзначили, що модель NVLM-D-72B не поступається LLaMA 3.1 від Meta в математичних оцінках і оцінках кодування, та ще й містить мультимодальні можливості. Така комбінація робить NVLM-D-72B помітним елементом у сфері штучного інтелекту, здатним конкурувати з набагато більшими моделями.

Підхід Nvidia до розробки ШІ з відкритим вихідним кодом може вплинути на напрямок розвитку галузі, потенційно заохочуючи інших технологічних гігантів відкривати свої власні моделі. Це може прискорити інновації, але також викликає занепокоєння щодо зловживання такими потужними інструментами. У міру того, як доступ до просунутого штучного інтелекту стає все більш поширеним, етичні та регуляторні проблеми забезпечення відповідального використання зростатимуть.

Випуск NVLM 1.0 також може змінити бізнес-моделі компаній, що займаються розробкою ШІ. Оскільки найсучасніші моделі знаходяться у вільному доступі, компаніям, можливо, доведеться переглянути способи утримання конкурентних переваг і створення цінності.