26.09.2024 17:24

Meta запускає Llama 3.2 з наміром конкурувати з OpenAI та Anthropic

На конференції Meta Connect 2024 генеральний директор компанії Марк Цукерберг представив Llama 3.2, велику мовну модель (LLM) з відкритим вихідним кодом і мультимодальними можливостями, що дозволяє їй розуміти як зображення, так і текст. Даний реліз відзначив значний прогрес Meta в галузі ШІ, позиціонуючи Llama 3.2 як прямого конкурента таким моделям, як Claude 3 Haiku від Anthropic та GPT4o-mini від OpenAI.

Llama 3.2 включає як малі та середні моделі з параметрами 11B і 90B, так і більш компактні малі мовні моделі з 1 та 3 мільярдами параметрів, призначені для використання на мобільних та периферійних пристроях. Завдяки довжині контексту в 128 000 токенів користувачі можуть вводити значні обсяги тексту, що робить її оптимальною для складних завдань, таких як візуальне міркування та аналіз документів.

Ця нова мультимодальна модель може обробляти різні випадки використання, пов’язані з зображеннями, такі як розуміння діаграм і графіків, підписи до зображень і визначення місця розташування об’єктів за описом природною мовою. Менші, компактні та легкі моделі призначені для персоналізованих застосунків, таких як узагальнення повідомлень або автоматизація таких завдань, як надсилання запрошень до календаря.

Мета також зробила моделі Llama 3.2 доступними для завантаження на сайтах llama.com, Hugging Face та партнерських платформах. Таким чином, Meta зміцнює свою прихильність до відкритого вихідного коду ШІ, який Цукерберг порівняв з Linux для ШІ, підкресливши економічну ефективність, можливість налаштування і надійність.

Компанія також представила вдосконалення для бізнес-користувачів, що дозволяє підприємствам створювати агентів зі штучним інтелектом, які обробляють запити клієнтів, інформацію про продукти та транзакції. Ці агенти легко інтегруються в WhatsApp і Messenger, демонструючи повідомлення за кліком.