25.08.2023 13:34
Meta щойно випустила версію для кодування Llama 2
Минулого місяця, коли компанія META представила Llama 2, надійну модель штучного інтелекту, подібну до тієї, що лежить в основі ChatGPT, вона надала розробникам, стартапам і дослідникам можливість попрацювати з тією моделлю штучного інтелекту, яка захоплює світ вже майже рік.
В продовження своїх досягнень, META представляє Code Llama, спеціалізовану версію моделі, доопрацьовану для задач програмування. Ця версія має потенціал розширити можливості кодування з допомогою ШІ для ширшої аудиторії розробників і сприяти інноваційним способам інтеграції ШІ в програмне забезпечення. Крім того, вона може зміцнити позиції META як провідного постачальника “відкритих” інструментів ШІ, сприяючи створенню нового ландшафту штучного інтелекту.
“Це чудово, що вони відкривають вагові коефіцієнти для спільноти”, — каже Діпак Кумар, дослідник зі Стенфорда.
Впровадження стандартної мовної моделі Meta, Llama 2, прискорило формування спільнот, присвячених вивченню її поведінки та потенційних модифікацій. За словами Кумара, ця версія забезпечила більшу гнучкість для заглиблення в її внутрішню роботу порівняно з моделями з закритим кодом, які пропонують Google або OpenAI.
Розробники готові створювати інноваційні додатки, використовуючи Code Llama. Кумар пропонує створити асистента програмування з посиленою перевіркою безпеки перед тим, як давати рекомендації щодо коду — концепція, що відповідає його дослідженням у сфері допомоги ШІ та безпеки коду. Крім того, він передбачає появу спеціалізованих помічників, пристосованих для конкретних завдань кодування, підкреслюючи універсальність моделі як основи для різних інструментів.
Талія Рінгер, доцент Університету Іллінойсу в Урбана-Шампейн, що спеціалізується на дослідженнях у сфері програмування, підкреслює академічну цінність Code Llama. Вона очікує підвищеного ентузіазму студентів до кодової моделі через характер їхньої роботи. Однак Рінгер підкреслює, що публікація навчальних даних була б корисною для всебічного розуміння та оцінки досліджень великих мовних моделей (LLM).
У сфері програмування нещодавні досягнення штучного інтелекту вже залишили помітний слід. У травні 2021 року GitHub, дочірня компанія Microsoft, представила Copilot — програмний плагін для кодування, який автоматично завершує сегменти коду на основі даних користувача, таких як перший рядок або коментар. Copilot використовує варіант GPT від OpenAI, потужної мовної моделі, що лежить в основі ChatGPT. Навчання цієї моделі розширюється за рахунок включення коду з репозиторію GitHub, а також потенційних внесків від підрядників, які коментують свій власний код.
Використання оупен-сорс коду за GitHub у навчальних даних призвело до судового позову, що спонукало Meta, ймовірно, вжити запобіжних заходів, обмеживши навчальні дані, щоб обійти такі юридичні складнощі. Вартість підписки на Copilot становить $10 на місяць для приватних осіб і $19 на місяць за користувача для підприємств.
Copilot привернув увагу розробників. Статистика GitHub за червень свідчить, що його використовують понад мільйон розробників та понад 200 000 компаній. Результати внутрішнього дослідження компанії показують, що Copilot значно прискорює виконання завдань з кодування, що призводить до помітного 30-відсоткового зростання продуктивності.
Зараз Meta представляє дві версії Code Llama: одна з них призначена для генерації коду на Python, інша — для перекладу команд природної мови в код. Пропозиція включає три розміри моделі, найменша з яких здатна працювати на одному графічному процесорі.
Навчальні дані Code Llama взяті з відкритих джерел, що дозволяє їй досягати успіху в таких популярних тестах на кодування, як HumanEval та Mostly Basic Python Problems. Мета стверджує, що вона перевершує існуючі моделі кодування з відкритим вихідним кодом і порівнянна з продуктивністю ChatGPT.
Амджад Масад, генеральний директор Replit, онлайн-платформи для кодування, що пропонує різні інструменти генеративного ШІ, вважає, що, хоча обмеженість навчальних даних Code Llama може перешкодити їй замінити Copilot, вона все ще має потенціал для розробників, які можуть експериментувати з агентами, що виконують практичні завдання, такі як пошук інформації в Інтернеті або використання API для бронювання рейсів чи замовлення їжі.
“Я думаю, що це дуже цікава сфера. Взаємодія, де ви можете вводити інструкції природною мовою, а модель може обробляти дані, може робити цікаві речі у світі”, — каже Масад.
Запуск Code Llama несе в собі потенційні переваги для Meta. Хоча компанії, можливо, не вистачає ChatGPT або пошукової системи зі штучним інтелектом, позиціонування себе як постачальника безкоштовних інструментів ШІ для розробників, бізнесу та дослідників може створити сильну позицію в конкурентній сфері генеративного ШІ. Рішення Meta прийняти відкритий підхід пов’язане з травневим інцидентом, коли рання версія Llama витекла в інтернет.
Примітно, що ні Llama 2, ні Code Llama не випускаються під звичайними ліцензіями з відкритим вихідним кодом, які дозволяють необмежене комерційне використання. Згідно з ліцензійними умовами Meta, користувачі не можуть використовувати ці моделі в додатках або сервісах з більш ніж 700 мільйонами користувачів щомісяця.
Нещодавнє дослідження підкреслює, що випуск інструментів штучного інтелекту може принести значні непрямі переваги компаніям, які стоять за ними. Це включає в себе прив’язку дослідників до їхніх інструментів і надання їм нових ідей, які можна масштабувати для більшого впливу.