01.02.2024 10:14
В Mistral підтвердили «витік» нової моделі ШІ з відкритим вихідним кодом, яка наближається до продуктивності GPT-4
У світі ШІ з відкритим вихідним кодом нещодавно відбулися бурхливі події. 28 січня користувач під ніком «Miqu Dev» опублікував на HuggingFace, провідній платформі для обміну моделями ШІ з відкритим вихідним кодом, набір файлів, які разом складали, здавалося б, нову модель великої мови з відкритим вихідним кодом (LLM), позначену як «miqu-1-70b».
Ця модель швидко привернула увагу спільноти, оскільки її продуктивність наближалася до продуктивності GPT-4 від OpenAI, яка до цього часу була найпотужнішою LLM у світі.
Спочатку не було ясно, хто створив модель «miqu-1-70b». Деякі припустили, що це може бути нова модель від Mistral, добре фінансованої паризької компанії з відкритим вихідним кодом, яка стоїть за Mixtral 8×7b, однією з найефективніших LLM з відкритим вихідним кодом на сьогодні.
31 січня генеральний директор Mistral Артур Менш підтвердив, що «miqu-1-70b» є квантованою версією старої моделі, яку компанія навчала і розповсюджувала досить відкрито. Він також повідомив, що Mistral працює над версією цієї моделі, яка наближається за своїми характеристиками до рівня GPT-4, або навіть може його перевершити.
Це потенційно є значним поворотним моментом у галузі ШІ з відкритим вихідним кодом. Випуск моделі класу GPT-4 з відкритим вихідним кодом, яка, ймовірно, буде функціонально безплатною для використання, створить величезний конкурентний тиск на OpenAI і його рівні підписки.