01.08.2024 16:23
Google оновила асортимент моделей штучного інтелекту з відкритим вихідним кодом
У червні Google представив Gemma 2, вдосконалену відкриту модель, доступну з 27 мільярдами (27B) та 9 мільярдами (9B) параметрів. Модель 27B швидко здобула популярність серед моделей з відкритим вихідним кодом та посіла одне з найкращих місць у рейтингу LMSYS Chatbot Arena, випередивши кілька більших моделей у діалогах з реальними користувачами.
Gemma 2 демонструє не лише високу продуктивність, але й відповідальне ставлення до використання штучного інтелекту, зосереджуючись на безпеці та доступності. В рамках цього зобов’язання Google додала три нові вдосконалення до лінійки Gemma 2. Першою з них є оновлена модель з 2 мільярдами параметрів (2B), яка містить розширені функції безпеки, зберігаючи при цьому міцний баланс між продуктивністю та ефективністю. Також Google представила набір моделей класифікатора безпечного контенту ShieldGemma, який призначений для фільтрації вхідних і вихідних даних моделей ШІ для підвищення безпеки користувачів. Насамкінець компанія запускає новий інструмент для інтерпретації Gemma Scope, який надає детальну інформацію про внутрішню роботу моделей.
Ці вдосконалення дозволяють дослідникам і розробникам створювати безпечніший користувацький досвід, глибше розуміти поведінку моделей і впевнено розгортати потужні рішення зі штучного інтелекту безпосередньо на пристроях. Цей прогрес відкриває нові шляхи для інновацій і підкреслює прихильність Google до відповідального розвитку ШІ.
Gemma 2 2B забезпечує продуктивність наступного покоління
Google нещодавно представив модель Gemma 2 2B, довгоочікуване доповнення до сімейства Gemma 2. Ця портативна модель демонструє високі результати завдяки використанню методів дистиляції, які були запозичені у великих аналогів. Примітно, що Gemma 2 2B перевершує всі моделі GPT-3.5 на Chatbot Arena, демонструючи свої чудові можливості розмовного ШІ.
Gemma 2 2B створена для забезпечення максимальної продуктивності, пропонуючи оптимальні результати для свого розміру та випереджаючи інші моделі з відкритим вихідним кодом у своїй категорії. Гнучкі та економічно вигідні варіанти розгортання дозволяють йому ефективно працювати на різноманітному обладнанні, від периферійних пристроїв і ноутбуків до потужних хмарних середовищ з використанням Vertex AI та Google Kubernetes Engine (GKE). Покращена оптимізація швидкості досягається за допомогою бібліотеки NVIDIA TensorRT-LLM, а сама модель доступна у вигляді NVIDIA NIM. Це забезпечує оптимальну продуктивність у різноманітних розгортаннях, включаючи центри обробки даних, хмарні середовища, локальні робочі станції, ПК і периферійні пристрої з графічними процесорами NVIDIA RTX, GeForce RTX або модулями Jetson для роботи з периферійним ШІ.
Крім того, Gemma 2 2B легко інтегрується з такими середовищами розробки, як Keras, JAX, Hugging Face, NVIDIA NeMo, Ollama і Gemma.cpp, а інтеграція з MediaPipe очікується найближчим часом. Це робить розробку та розгортання простими та ефективними.
ShieldGemma допоможе захистити користувачів сучасними класифікаторами безпеки
Відповідальне розгортання відкритих моделей для забезпечення привабливих, безпечних та інклюзивних результатів застосування штучного інтелекту вимагає значних зусиль від розробників та дослідників. Щоб підтримати ці зусилля, Google випустила серію сучасних класифікаторів безпеки ShieldGemma, призначених для виявлення та зменшення шкідливого контенту у вхідних та вихідних даних моделей штучного інтелекту. ShieldGemma націлена на чотири ключові сфери шкоди: мова ворожнечі, переслідування, відверто сексуальний контент та небезпечний контент.
Ці відкриті класифікатори доповнюють наявний набір класифікаторів безпеки Google в межах набору інструментів Responsible AI Toolkit. Цей набір включає методологію створення класифікаторів, адаптованих до конкретних правил з обмеженою кількістю точок даних, а також готові класифікатори Google Cloud, що надаються через API.
ShieldGemma, створений на базі Gemma 2, пропонує провідну ефективність класифікації безпеки у своїй галузі. Він доступний у різних розмірах для задоволення різноманітних потреб. Модель 2B ідеально підходить для завдань онлайн класифікації, а версії 9B і 27B забезпечують вищу продуктивність для автономних застосунків, де затримка є менш важливою. Всі розміри використовують оптимізацію швидкості NVIDIA для ефективної роботи на різних конфігураціях обладнання. Відкритий характер ShieldGemma сприяє прозорості та співпраці у спільноті ШІ, що робить внесок у майбутнє стандартів безпеки індустрії машинного навчання.
«У міру того, як ШІ продовжує розвиватися, вся галузь повинна буде інвестувати в розробку високоефективних оцінювачів безпеки. Ми раді бачити, що Google робить такі інвестиції, і сподіваємося на їхню подальшу участь у нашій робочій групі з безпеки ШІ», — прокоментувала Ребека Вайс, виконавчий директор ML Commons.
Gemma Scope висвітлює процес прийняття рішень ШІ за допомогою відкритих розріджених автокодерів
Gemma Scope дозволяє дослідникам і розробникам отримати можливість спостерігати за процесом прийняття рішень у моделях Gemma 2. Працюючи як потужний мікроскоп, Gemma Scope використовує розріджені автокодери (sparse autoencoders, SAE) для збільшення деталізації певних точок у моделі, що робить її внутрішню роботу більш зрозумілою для інтерпретації.
SAE є спеціалізованими нейронними мережами, які допомагають розпаковувати щільну, комплексну інформацію, що обробляється Gemma 2, перетворюючи її у форму, яку легше аналізувати та розуміти. Вивчаючи ці розширені уявлення, дослідники можуть отримати цінну інформацію про те, як Gemma 2 виявляє закономірності, обробляє інформацію і, зрештою, робить прогнози. За допомогою Gemma Scope Google прагне допомогти дослідницькій спільноті в галузі ШІ створювати більш зрозумілі, підзвітні та надійні системи ШІ.
Gemma Scope містить понад 400 вільно доступних SAE, що охоплюють всі рівні Gemma 2 2B і 9B, забезпечуючи повну прозорість. Інтерактивні демонстрації на Neuronpedia дозволяють користувачам вивчати можливості SAE та аналізувати поведінку моделі без написання коду, що робить інструмент доступним та зручним для користувачів. Простий у використанні репозиторій містить код та приклади для взаємодії з SAE та Gemma 2, що спрощує інтеграцію та експерименти.