21.10.2024 14:31
IBM випустила великі мовні моделі Granite 3.0 з відкритим вихідним кодом
IBM розширює свою присутність у корпоративному ШІ, випустивши великі мовні моделі Granite 3.0. Нові моделі мають на меті переосмислити корпоративні застосунки зі штучним інтелектом, зосередившись на рішеннях з відкритим вихідним кодом і можливостях налаштування для корпоративного використання. Моделі Granite 3.0 мають від 2 до 8 мільярдів параметрів і призначені для забезпечення різноманітних потреб підприємств, включаючи обслуговування клієнтів, автоматизацію ІТ та кібербезпеку.
Однією з ключових особливостей Granite 3.0 є InstructLab, яка дозволяє тонко налаштовувати моделі відповідно до конкретних бізнес-вимог. IBM також представила моделі Mixture-of-Experts (MoE) та моделі Guardian, останні з яких мають розширені функції безпеки для забезпечення рівня надійності та запобігання шкідливим результатам.
Головною особливістю запуску є прихильність IBM до створення корпоративного штучного інтелекту з відкритим вихідним кодом, адже моделі Granite випускаються під ліцензією Apache 2.0. Це контрастує з іншими моделями, такими як Llama від Meta, які не дотримуються ліцензій, затверджених Ініціативою відкритого програмного забезпечення. Дозвільна ліцензія дає партнерам IBM гнучкість у створенні власних рішень на основі технології Granite, сприяючи інноваціям.
IBM не обмежується лише генеративним штучним інтелектом, а починає працювати над генеративними обчисленнями — новою концепцією, яка передбачає програмування комп’ютерів за допомогою зразків або підказок, а не чітких інструкцій. Цей підхід узгоджується з можливостями великих мовних моделей, що потенційно створює основу для подальшого прогресу в автоматизації на основі ШІ.
Зосередження IBM на продуктивності, безпеці та співпраці за допомогою відкритого коду виводить компанію на провідні позиції в галузі корпоративних інновацій у сфері ШІ, оскільки вона продовжує кидати виклик таким конкурентам, як Google та Anthropic, у тестах на продуктивність.