BTC$29880

ETH$3666

Шукати

Mistral випустив свою першу мультимодальну модель Pixtral 12B

Французький стартап Mistral, що займається розробкою штучного інтелекту, випустив свою першу мультимодальну модель штучного інтелекту Pixtral 12B, призначену для обробки тексту та зображень. Модель побудована на основі попередньої текстової моделі Mistral, Nemo 12B та має 12 мільярдів параметрів з вагою близько 24 Гб. Подібно до інших передових систем штучного інтелекту, таких як GPT-4 від OpenAI та сімейство Claude від Anthropic, Pixtral 12B може аналізувати зображення, відповідаючи на запитання, додаючи підписи або підраховуючи об’єкти на зображеннях.

Ця модель забезпечує значну гнучкість, оскільки може обробляти зображення будь-якого розміру, надані через URL-адреси або у форматах, закодованих у base64, що робить її універсальним інструментом для різних мультимодальних застосувань. Наразі Pixtral 12B ще не доступний для тестування в реальному часі, але компанія підтвердила, що незабаром він буде доступний через її платформи Le Chat і Le Platforme для використання чат-ботів і API.

Наразі модель доступна через торрент-посилання на GitHub та Hugging Face, її можна налаштувати як для дослідницьких, так і для комерційних цілей, хоча конкретні умови ліцензування Pixtral 12B залишаються непідтвердженими. Раніше стартап пропонував відкриті моделі під такими ліцензіями, як Apache 2.0, але для комерційного використання стягував плату.

Випуск Pixtral 12B відбувся після потужного раунду фінансування Mistral на суму 645 мільйонів доларів, який оцінив компанію в 6 мільярдів доларів. Вважаючись провідним інноватором ШІ в Європі, Mistral продовжує кидати виклик лідерам ринку, випускаючи моделі з відкритим вихідним кодом і пропонуючи послуги корпоративним клієнтам. Однак, як і багато фірм, що займаються розробкою ШІ, вона може зіткнутися з перевірками щодо використання публічних даних для навчання моделей, оскільки питання авторських прав і прав на дані залишаються суперечливими.