09.10.2024 11:50
Anthropic кидає виклик OpenAI за допомогою економічної пакетної обробки
Компанія Anthropic представила свій новий програмний інтерфейс для обробки пакетів повідомлень Message Batches API — інструмент, покликаний допомогти компаніям більш ефективно керувати обробкою великих обсягів даних. Цей інтерфейс, здатний обробляти до 10 000 асинхронних запитів протягом 24 годин, пропонує значну економічну перевагу, скорочуючи витрати на обробку вдвічі порівняно зі стандартними зверненнями до програми. Це робить просунуті моделі більш доступними для підприємств, які працюють з великими обсягами даних. Функція пакетної обробки даних орієнтована на підприємства, які раніше не могли дозволити собі використовувати великомасштабні програми штучного інтелекту, і відкриває шлях до ширшого і регулярнішого аналізу даних.
Економічна вигода Message Batches API виходить за рамки звичайного заощадження коштів; вона відображає ширшу зміну цінових стратегій використання штучного інтелекту. Рішення Anthropic, що пропонує пакетну обробку даних за зниженими цінами, забезпечує економію на обчисленнях штучного інтелекту коштом масштабування, посилюючи конкуренцію з OpenAI, який на початку року запустив аналогічну послугу. Така модель тарифікації може сприяти розширенню впровадження ШІ серед середнього бізнесу, дозволяючи йому використовувати можливості штучного інтелекту, які раніше були недосяжними для нього.
Модель | Вхідні витрати (на 1М токенів) | Вихідна вартість (на 1 млн. токенів) | Контекстне вікно |
GPT-4o | $1.25 | $5.00 | 128K |
Claude 3.5 Sonnet | $1.50 | $7.50 | 200K |
Пакетний API від Anthropic сумісний з моделями Claude 3.5 Sonnet, Claude 3 Opus і Claude 3 Haiku. Надалі планується ще більше інтеграцій, включаючи підтримку Claude на Vertex AI в Google Cloud і пакетний аналіз через Amazon Bedrock. Перехід від обробки в реальному часі до пакетної обробки свідчить про еволюцію розуміння потреб корпоративного ШІ. Хоча обробка в режимі реального часу вже давно перебуває в центрі уваги, рішення Anthropic передбачає, що обробка «в потрібний час» — надання результатів у відповідні часові рамки, а не миттєво — може бути більш практичною та економічно ефективною для багатьох корпоративних застосунків.
Нова модель спонукає компанії переосмислити свій підхід до штучного інтелекту, збалансувати швидкість і вартість для оптимізації своїх операцій. Тепер компанії можуть розглянути можливість розподілу робочих навантажень між обробкою в режимі реального часу та пакетною обробкою, щоб знайти баланс, який максимізує ефективність та економію коштів. Однак зростання пакетної обробки може також створити певні проблеми. Існує ризик, що нижча вартість пакетних операцій може зменшити прагнення до підвищення можливостей штучного інтелекту для обробки даних у реальному часі. Повільніша, асинхронна природа пакетної обробки може також обмежити інновації у сферах, де негайна реакція ШІ має вирішальне значення, таких як прийняття рішень у реальному часі та інтерактивні інструменти ШІ.