21.02.2024 16:57
Google DeepMind повертається до перегонів ШІ з відкритим вихідним кодом з новою моделлю Gemma
Google DeepMind представила Gemma — свої нові моделі з відкритим вихідним кодом 2B і 7B, побудовані на основі досліджень і технологій, що використовувалися для створення нещодавно анонсованих моделей Gemini.
Моделі Gemma будуть випущені з попередньо навченими варіантами, налаштованими за допомогою інструкцій, повідомила Google DeepMind у своєму блозі. Вагові моделі будуть доступні за комерційною ліцензією, а також із новим інструментарієм відповідального генеративного ШІ.
Google також забезпечує інструментарій для виведення та контрольованої тонкої настройки (SFT) для всіх основних фреймворків: JAX, PyTorch і TensorFlow через власний Keras 3.0. Готові до використання Colab та Kaggle, а Gemma інтегрована з Hugging Face, MaxText та NVIDIA NeMo. Попередньо навчені та налаштовані моделі Gemma можуть працювати на ноутбуці, робочій станції або в Google Cloud з розгортанням на Vertex AI та Google Kubernetes Engine.
Сьогодні Nvidia також оголосила, що у співпраці з Google запускає оптимізацію на всіх платформах NVIDIA AI, включаючи локальні комп’ютери RTX AI, для прискорення продуктивності Gemma.
Google тепер пропонує як API, так і відкриті моделі для робочого процесу. Джанін Бенкс, віцепрезидент і генеральний менеджер розробника X і керівник відділу по роботі з розробниками в Google, розповіла, що моделі Gemma «відчуваються як продовження» історії відкритих технологій Google для розробки ШІ, починаючи з таких інструментів, як TensorFlow і Jax, і закінчуючи іншими моделями та системами ШІ, такими як PaLM2 та AlphaFold, які привели до Gemini.
«Pавдяки зворотному зв’язку під час розробки моделей Gemini, Google DeepMind отримав ключове розуміння, яке полягає в тому, що в деяких випадках розробники будуть використовувати як відкриті моделі, так і API, доповнюючи один одного у своєму робочому процесі, залежно від того, на якому етапі робочого процесу вони знаходяться», — також зазначила вона.
Google DeepMind планує випустити повний набір бенчмарків для оцінки Gemma порівняно з іншими моделями. Тріс Уоркентін, директор з управління продуктами Google DeepMind, розповів, що компанія забезпечує прозорий і відкритий для спільноти підхід до оцінки моделей Gemma.