HyperWrite представила потужну модель ШІ з відкритим кодом Reflection 70B
Генеральний директор HyperWrite Метт Шумер представив Reflection 70B, вдосконалену велику мовну модель (LLM), засновану на Meta Llama 3.1-70B Instruct.
HyperWrite представила потужну модель ШІ з відкритим кодом Reflection 70B
Генеральний директор HyperWrite Метт Шумер представив Reflection 70B, вдосконалену велику мовну модель (LLM), засновану на Meta Llama 3.1-70B Instruct.
OpenAI повідомила про досягнуту аудиторію в 1 мільйон бізнес-користувачів
Компанія OpenAI досягла значного результату завдяки своїм платним бізнес-пропозиціям — ChatGPT Enterprise, Team та Edu, які досягли позначки в один мільйон платних користувачів.
Sakana AI залучає $100 млн для конкуренції з OpenAI та Anthropic
Глобальні перегони у галузі штучного інтелекту набирають обертів: японський стартап Sakana AI заявив про себе всього за кілька днів після анонсу Qwen2-VL від Alibaba.
Розмовний ШІ на основі великих мовних моделей посилює неправдиві спогади
Поява розмовних систем штучного інтелекту, особливо тих, що працюють на основі великих мовних моделей, внесла нові складнощі у взаємодію людини з технологіями.
Anthropic опублікувала підказки Claude та зробила Artifacts загальнодоступними
Anthropic відкрив загальний доступ до Artifacts для всіх користувачів. Також компанія опублікувала системні підказки для своїх моделей Claude, розкриваючи детальні інструкції, які керують поведінкою Claude, межами знань та стилем взаємодії.
Inflection AI переносить дані чатботів Pi на тлі стратегічних змін
Стартап Inflection AI, який створив асистента Pi AI, зробив нещодавню заяву про партнерство з некомерційною організацією Data Transfer Initiative (DTI), щоб дозволити користувачам експортувати свої дані з платформи.
Доступне точне налаштування для GPT-4o
Завдяки новому функціоналу розробники можуть тонко налаштовувати модель GPT-4o, використовуючи власні набори даних, що дозволяє їм досягти вищої продуктивності з меншими витратами відповідно до їхніх конкретних випадків використання.
Nvidia створила компактну мовну модель Llama-3.1-Minitron 4B
У той час як технологічні компанії змагаються за впровадження штучного інтелекту на пристроях, з’являється все більше досліджень, які зосереджені на створенні малих мовних моделей, здатних працювати на пристроях з обмеженими ресурсами.
LLM розвивають власне розуміння реальності разом з покращенням мовних здібностей
Дослідники з Лабораторії комп’ютерних наук та штучного інтелекту Массачусетського технологічного інституту (CSAIL) виявили цікаві результати, які вказують на те, що мовні моделі можуть розвивати власне розуміння реальності для покращення своїх генеративних здібностей.
Лабораторія технологій глибокого навчання Lambda представила нову модель Hermes 3
Розробник інфраструктурних рішень для штучного інтелекту та інновацій Lambda у партнерстві з Nous Research запустили Hermes 3 — вдосконалену версію великої мовної моделі Llama 3.1 з 405 мільярдами параметрів від компанії Meta.
Нова функція Claude від Anthropic дозволяє розробникам уникати повторюваних підказок
Anthropic представила нову функцію кешування підказок у своєму програмному інтерфейсі, доступну в публічній бета-версії для моделей Claude 3.5 Sonnet і Claude 3 Haiku.
«ШІ-вчений» має на меті автоматизувати наукові відкриття
Токійська компанія Sakana AI представила свій проєкт — систему штучного інтелекту «The AI Scientist». Цей інструмент спроможний самостійно проводити наукові дослідження від пошуку ідеї до написання готової статті, включаючи створення експериментів, аналіз даних та навіть симуляцію процесу рецензування.