08.02.2024 09:33
Відкрита мовна модель Smaug-72B претендує на звання найкращої у світі
Нещодавно стартап Abacus AI привернув увагу світу ШІ з відкритим вихідним кодом, випустивши нову мовну модель під назвою Smaug-72B. Ця модель стала відома завдяки високим рейтингам, які вона отримала на платформі Hugging Face, одній з провідних у сфері обробки природної мови (NLP).
Smaug-72B є технічно покращеною версією попередньої моделі Qwen-72, яка була розроблена командою дослідників з Alibaba Group. Ця нова мовна модель вирізняється своїми вражаючими досягненнями, перевершивши в багатьох оцінках дві з найпотужніших власницьких моделей — GPT-3.5 від OpenAI та Mistral Medium. Також важливо відзначити, що Smaug-72B перевершує й модель Qwen-72B, на основі якої вона була розроблена.
За даними рейтингу Hugging Face Open LLM, що вимірює ефективність мовних моделей з відкритим вихідним кодом, Smaug-72 є першою моделлю, яка здобула середній бал понад 80 у всіх основних оцінках LLM. Хоча ця модель ще не досягла рівня людської продуктивності в оцінці 90-100 балів, її поява свідчить про те, що майбутнє ШІ з відкритим вихідним кодом може бути досить багатообіцяльним.
Важливо також відзначити внесок компанії Abacus AI у випуск цієї моделі. За словами генерального директора Abacus AI Бінду Редді, їхній наступний крок — опублікувати методики цієї моделі як наукову роботу і використовувати їх для поліпшення інших моделей.
Крім того, разом з Smaug-72B також варто відзначити випуск моделі Qwen 1.5 від групи Qwen. Ця модель також вражає своєю продуктивністю та можливостями, випереджаючи навіть відомі пропрієтарні моделі.
Поява цих нових моделей відкриває нові можливості для розвитку ШІ, а також свідчить про те, що інновації в цій області можуть бути доступними для широкого кола користувачів завдяки відкритому вихідному коду.
Нагадаємо, у серпні Alibaba представила Qwen-VL, модель мови технічного зору для тексту та зображень.