SambaNova кидає виклик моделі o1 від OpenAI
Компанія SambaNova Systems представила демо власної великої мовної моделі на Hugging Face, позиціонуючи себе як сильного конкурента моделі o1 від OpenAI.
SambaNova кидає виклик моделі o1 від OpenAI
Компанія SambaNova Systems представила демо власної великої мовної моделі на Hugging Face, позиціонуючи себе як сильного конкурента моделі o1 від OpenAI.
Nvidia створила компактну мовну модель Llama-3.1-Minitron 4B
У той час як технологічні компанії змагаються за впровадження штучного інтелекту на пристроях, з’являється все більше досліджень, які зосереджені на створенні малих мовних моделей, здатних працювати на пристроях з обмеженими ресурсами.
Лабораторія технологій глибокого навчання Lambda представила нову модель Hermes 3
Розробник інфраструктурних рішень для штучного інтелекту та інновацій Lambda у партнерстві з Nous Research запустили Hermes 3 — вдосконалену версію великої мовної моделі Llama 3.1 з 405 мільярдами параметрів від компанії Meta.
Meta випускає Llama 3.1
Meta випускає Llama 3.1, яка має 405 мільярдів параметрів, перевершує конкурентів у математиці, кодуванні та багатомовних завданнях, згідно з заявою компанії.
Llama.ttf об’єднав велику мовну модель зі шрифтами
Концепція llama.ttf являє собою цікаву суміш типографіки та штучного інтелекту, в якій файл шрифту є одночасно великою мовною моделлю (LLM) та механізмом виведення для цієї моделі.
ШІ та теорія розуму: чи можуть GPT-4 та LLaMA-2 мислити як люди?
Дослідники з Університетського медичного центру Гамбург-Еппендорф, Італійського технологічного інституту в Генуї, Університету Тренто та інших інституцій дослідили, чи здатні великі мовні моделі (LLM), такі як GPT-4, GPT-3.5 та LLaMA2-70B, розуміти людські думки та емоції.
Meta анонсує Llama 3 і запускає спеціальний веб-портал про ШІ
Нещодавній анонс Llama 3 від компанії Meta знаменує собою важливу віху у сфері великих мовних моделей, позиціонуючи себе як значний прогрес порівняно з попередньою версією, Llama 2.
Стенфордські дослідники критикують прозорість моделей ШІ від OpenAI та інших
Дослідники Стенфордського університету опублікували звіт, в якому стверджують, що основні моделі штучного інтелекту (ШІ) від OpenAI, Google, Meta та інших компаній є недостатньо прозорими.
Meta спростовує звинувачення в порушенні авторських прав при навчанні ШІ
У позові проти Сари Сільверман та інших авторів компанія Meta стверджує, що її система штучного інтелекту не створює матеріалів, що порушують авторські права.
Ітеративна модель великої мови, з можливістю самоперевірки та генеруванням зворотного зв’язку
Нещодавнє дослідження підкреслило ефективність включення зворотного зв'язку на природній мові для підвищення продуктивності мовних моделей. Команда дослідників з KAIST представила інноваційну модель під назвою SelFee, спеціально розроблену для отримання зворотного зв'язку та саморедагування.
Meta щойно випустила версію для кодування Llama 2
Минулого місяця, коли компанія META представила Llama 2, надійну модель штучного інтелекту, подібну до тієї, що лежить в основі ChatGPT, вона надала розробникам, стартапам і дослідникам можливість попрацювати з тією моделлю штучного інтелекту, яка захоплює світ вже майже рік.
Llama-2-7B-32K-Instruct це прорив в обробці розширених контекстних мов
Обробка природної мови стикається зі складними викликами, пов'язаними з ефективним розумінням і реагуванням на складні та довгі інструкції. Зі збільшенням кількості нюансів у спілкуванні стають очевидними обмеження існуючих моделей в обробці великих контекстних заплутаностей.