29.07.2024 17:40

ШІ з відкритим вихідним кодом зменшує розрив з лідерами ринку програмного забезпечення

Стартап Galileo, який займається розробками в галузі штучного інтелекту, опублікував результати дослідження, які свідчать про те, що мовні моделі з відкритим вихідним кодом швидко скорочують розрив у продуктивності з пропрієтарними аналогами. Цей зсув може демократизувати передові можливості ШІ та прискорити інновації в різних галузях.

У другому щорічному Індексі галюцинацій Galileo оцінив 22 великі мовні моделі на предмет їхньої схильності генерувати некоректну інформацію. Моделі з закритим вихідним кодом все ще лідирують, але різниця між ними значно скоротилася. Вікрам Чаттерджі, співзасновник і генеральний директор Galileo, відзначив значне покращення у моделях з відкритим кодом порівняно з жовтнем 2023 року.

Ця тенденція може сприяти зниженню рівня доступу до ринку для стартапів та дослідників, водночас змушуючи вже чинних учасників ринку впроваджувати інновації швидше, або вони ризикують втратити свої позиції. Примітно, що Claude 3.5 Sonnet від Anthropic очолив індекс, витіснивши з нього моделі OpenAI, які домінували в торішньому рейтингу. Цей зсув вказує на зміну правил у перегонах озброєнь ШІ, коли нові учасники кидають виклик визнаним лідерам.

Claude 3.5 Sonnet чудово показав себе в коротких, середніх і довгих контекстних діапазонах з підтримкою до 200 тис. контекстних вікон, що вказує на те, що він може працювати з ще більшими наборами даних. Індекс також підкреслив економічну ефективність. Gemini 1.5 Flash від Google виявився найефективнішим варіантом, що забезпечує високі результати за частку ціни топових моделей.

Різниця у вартості може спонукати компанії впроваджувати більш ефективні моделі, навіть якщо вони не очолюють рейтинги ефективності. Qwen2-72B-Instruct від Alibaba показала найкращі результати серед моделей з відкритим вихідним кодом, що демонструє тенденцію, коли неамериканські компанії досягають значних успіхів у розробці ШІ.

Чаттерджі розглядає це як частину ширшої демократизації технології ШІ, що дозволяє розробникам з усього світу створювати чудові продукти. Індекс фокусується на тому, як моделі обробляють контекст різної довжини, від коротких фрагментів до довгих документів, що відображає розширення використання ШІ для таких завдань, як узагальнення довгих звітів або відповіді на питання про великі набори даних.

Отримані результати можуть суттєво вплинути на впровадження ШІ на підприємствах. Оскільки моделі з відкритим вихідним кодом удосконалюються і стають більш економічно ефективними, компанії можуть розгортати потужні можливості ШІ, не покладаючись на використання платних платформ, що потенційно сприятиме підвищенню продуктивності та впровадженню інновацій.

Galileo, що надає інструменти для моніторингу та вдосконалення систем штучного інтелекту, має на меті допомогти підприємствам орієнтуватися в мінливому ландшафті мовних моделей. Пропонуючи практичні бенчмарки, Galileo позицює себе як важливий ресурс для осіб, які приймають технічні рішення. Стартап планує щоквартально оновлювати результати тесту, надаючи постійне розуміння змін у балансі між технологіями штучного інтелекту для бізнесу з відкритим вихідним кодом та приватними технологіями.