01.02.2024 10:14

В Mistral підтвердили «витік» нової моделі ШІ з відкритим вихідним кодом, яка наближається до продуктивності GPT-4

У світі ШІ з відкритим вихідним кодом нещодавно відбулися бурхливі події. 28 січня користувач під ніком «Miqu Dev» опублікував на HuggingFace, провідній платформі для обміну моделями ШІ з відкритим вихідним кодом, набір файлів, які разом складали, здавалося б, нову модель великої мови з відкритим вихідним кодом (LLM), позначену як «miqu-1-70b».

Ця модель швидко привернула увагу спільноти, оскільки її продуктивність наближалася до продуктивності GPT-4 від OpenAI, яка до цього часу була найпотужнішою LLM у світі.

Спочатку не було ясно, хто створив модель «miqu-1-70b». Деякі припустили, що це може бути нова модель від Mistral, добре фінансованої паризької компанії з відкритим вихідним кодом, яка стоїть за Mixtral 8×7b, однією з найефективніших LLM з відкритим вихідним кодом на сьогодні.

31 січня генеральний директор Mistral Артур Менш підтвердив, що «miqu-1-70b» є квантованою версією старої моделі, яку компанія навчала і розповсюджувала досить відкрито. Він також повідомив, що Mistral працює над версією цієї моделі, яка наближається за своїми характеристиками до рівня GPT-4, або навіть може його перевершити.

An over-enthusiastic employee of one of our early access customers leaked a quantised (and watermarked) version of an old model we trained and distributed quite openly.

To quickly start working with a few selected customers, we retrained this model from Llama 2 the minute we got…
— Arthur Mensch (@arthurmensch) January 31, 2024

Це потенційно є значним поворотним моментом у галузі ШІ з відкритим вихідним кодом. Випуск моделі класу GPT-4 з відкритим вихідним кодом, яка, ймовірно, буде функціонально безплатною для використання, створить величезний конкурентний тиск на OpenAI і його рівні підписки.