BTC$29880

ETH$3666

Шукати

#LLM

Anthropic опублікувала підказки Claude та зробила Artifacts загальнодоступними

Anthropic відкрив загальний доступ до Artifacts для всіх користувачів. Також компанія опублікувала системні підказки для своїх моделей Claude, розкриваючи детальні інструкції, які керують поведінкою Claude, межами знань та стилем взаємодії.

Доступне точне налаштування для GPT-4o

Завдяки новому функціоналу розробники можуть тонко налаштовувати модель GPT-4o, використовуючи власні набори даних, що дозволяє їм досягти вищої продуктивності з меншими витратами відповідно до їхніх конкретних випадків використання.

Nvidia створила компактну мовну модель Llama-3.1-Minitron 4B

У той час як технологічні компанії змагаються за впровадження штучного інтелекту на пристроях, з’являється все більше досліджень, які зосереджені на створенні малих мовних моделей, здатних працювати на пристроях з обмеженими ресурсами.

LLM розвивають власне розуміння реальності разом з покращенням мовних здібностей

Дослідники з Лабораторії комп’ютерних наук та штучного інтелекту Массачусетського технологічного інституту (CSAIL) виявили цікаві результати, які вказують на те, що мовні моделі можуть розвивати власне розуміння реальності для покращення своїх генеративних здібностей.

Лабораторія технологій глибокого навчання Lambda представила нову модель Hermes 3

Розробник інфраструктурних рішень для штучного інтелекту та інновацій Lambda у партнерстві з Nous Research запустили Hermes 3 — вдосконалену версію великої мовної моделі Llama 3.1 з 405 мільярдами параметрів від компанії Meta.

«ШІ-вчений» має на меті автоматизувати наукові відкриття

Токійська компанія Sakana AI представила свій проєкт — систему штучного інтелекту «The AI Scientist». Цей інструмент спроможний самостійно проводити наукові дослідження від пошуку ідеї до написання готової статті, включаючи створення експериментів, аналіз даних та навіть симуляцію процесу рецензування.