25.10.2024 18:41

Cohere запускає нові моделі штучного інтелекту для подолання глобального мовного розриву

Моделі Aya Expanse 8B та 35B від Cohere, відтепер доступні на платформі Hugging Face. Вони покликані вдосконалити багатомовний ШІ, заповнюючи прогалини мовної доступності в базових моделях. Спираючись на Aya 101 LLM (випущену в лютому), ці нові моделі продовжують прагнення проєкту Aya до розширення мовної інклюзивності. У той час як модель 8B позиціюється як інструмент для міжнародних дослідників, версія 35B пропонує найвищу продуктивність на 23 мовах, перевершуючи аналогічні моделі від Google, Mistral та Meta у багатомовних тестах.

Завдяки своєму особливому підходу до навчання, що поєднує арбітраж даних та навчання на основі вподобань, Aya позбавляє моделі надмірної залежності від синтетичних даних, які часто виявляються неефективними у мовах з обмеженими ресурсами через брак високоякісних «навчальних» моделей. Цей метод не лише підвищує точність у мовах, де англійська не є основною мовою, але й включає протоколи безпеки, що враховують культурні нюанси. На відміну від традиційних систем безпеки, які часто не враховують лінгвістичне розмаїття, підхід Aya спрямований на уникнення упередженості, та адаптацію до глобальних лінгвістичних контекстів.

Разом із цими вдосконаленнями, Cohere також випустила оновлення для Embed 3, яке розширило можливості пошуку зображень і покращило точне налаштування моделі Command R 08-2024. Ці успіхи позиціюють Cohere як важливого розробника, який розширює сферу застосування ШІ в різних мовах і культурних контекстах, відповідаючи на попит на інклюзивність ШІ.