24.05.2024 09:23
Cohere випускає Aya 23: потужні багатомовні LLM з відкритими вагами
Cohere for AI (C4AI), некомерційний дослідницький підрозділ канадського стартапу Cohere, що займається ШІ, оголосив про випуск Aya 23 — нового сімейства сучасних багатомовних мовних моделей з відкритими ваговими коефіцієнтами.
Модель, доступна у варіантах 8B та 35B параметрів, є наступницею Aya 101 та розширює мовні можливості до 23 мов. Це арабська, китайська (спрощена та традиційна), чеська, голландська, англійська, французька, німецька, грецька, іврит, хінді, індонезійська, італійська, японська, корейська, перська, польська, португальська, румунська, російська, іспанська, турецька, українська та в’єтнамська мови.
Важливо зазначити, що C4AI робить ваги Aya 23 відкритими. Це дозволяє стороннім дослідникам налаштувати модель відповідно до своїх потреб, що робить її більш гнучкою та доступною, порівняно з деякими іншими моделями.
Aya 23 ґрунтується на оригінальній моделі Aya 101 та значно покращує її продуктивність. За даними C4AI, Aya 23 демонструє:
- 14% зростання у виконанні дискримінаційних завдань;
- 20% зростання у виконанні генеративних завдань;
- 41,6% зростання у багатомовному MMLU;
- 6,6-кратне збільшення у багатомовному математичному мисленні.
Ці покращення роблять Aya 23 більш потужною та універсальною мовною моделлю, що робить її цінним інструментом для дослідників та розробників, які працюють над багатомовними проєктами.
C4AI випустила відкриті ваги для моделей 8B і 35B на Hugging Face, а також безплатний доступ до них на своєму майданчику. Це робить Aya 23 доступною для широкого кола користувачів.
Нагадаємо, у квітні Cohere AI випустила Cohere Toolkit — комплексний інструментарій з відкритим кодом, покликаний прискорити розробку ШІ-додатків для підприємств.