BTC$29880

ETH$3666

Шукати

#LLM

Доступне точне налаштування для GPT-4o

Завдяки новому функціоналу розробники можуть тонко налаштовувати модель GPT-4o, використовуючи власні набори даних, що дозволяє їм досягти вищої продуктивності з меншими витратами відповідно до їхніх конкретних випадків використання.

Nvidia створила компактну мовну модель Llama-3.1-Minitron 4B

У той час як технологічні компанії змагаються за впровадження штучного інтелекту на пристроях, з’являється все більше досліджень, які зосереджені на створенні малих мовних моделей, здатних працювати на пристроях з обмеженими ресурсами.

LLM розвивають власне розуміння реальності разом з покращенням мовних здібностей

Дослідники з Лабораторії комп’ютерних наук та штучного інтелекту Массачусетського технологічного інституту (CSAIL) виявили цікаві результати, які вказують на те, що мовні моделі можуть розвивати власне розуміння реальності для покращення своїх генеративних здібностей.

Лабораторія технологій глибокого навчання Lambda представила нову модель Hermes 3

Розробник інфраструктурних рішень для штучного інтелекту та інновацій Lambda у партнерстві з Nous Research запустили Hermes 3 — вдосконалену версію великої мовної моделі Llama 3.1 з 405 мільярдами параметрів від компанії Meta.

«ШІ-вчений» має на меті автоматизувати наукові відкриття

Токійська компанія Sakana AI представила свій проєкт — систему штучного інтелекту «The AI Scientist». Цей інструмент спроможний самостійно проводити наукові дослідження від пошуку ідеї до написання готової статті, включаючи створення експериментів, аналіз даних та навіть симуляцію процесу рецензування.

Дослідники IBM представили технологію діалогового керування підказками

Створення ефективних підказок може бути складним завданням, коли бажані результати мають творчий або варіативний вигляд. Цей процес зазвичай займає багато часу й потребує наявності певного досвіду, особливо якщо для формування підказок використовуються марковані набори даних.

LG AI Research випустила сучасну мовну модель EXAONE 3.0 з відкритим вихідним кодом

LG AI Research зробила новий крок у розвитку, випустивши вдосконалену версію великої мовної моделі EXAONE 3.0. Нова модель має низку функцій і вдосконалень, які вирізняють її на тлі конкурентів у галузі розробки штучного інтелекту, зокрема завдяки відкритому вихідному коду та значній кількості параметрів у 7,8 мільярда, забезпечуючи легку адаптацію до останніх технологічних тенденцій. Ключові вдосконалення в EXAONE […]

Lasso Security встановлює новий стандарт безпеки LLM

Контролю доступу на основі ролей (RBAC) не вистачає гнучкості для адаптації до контекстних запитів, а контроль доступу на основі атрибутів (ABAC) обмежений проблемами масштабованості та вищими витратами на обслуговування. Враховуючи ці обмеження, компанія Lasso Security розробила контекстно-орієнтований контроль доступу (CBAC).

Groq залучає $640 млн, щоб прискорити ШІ за допомогою мовного процесора нового покоління

Компанія Groq, розробник технологій у галузі штучного інтелекту, залучила 640 мільйонів доларів США в рамках раунду фінансування серії D, чим ознаменувала важливий момент у розвитку інфраструктури ШІ.