
Apple представила ReALM, нову модель, яка «бачить» і розуміє контекст екрана
Дослідники Apple представили ReALM, нову модель, яка може «бачити» та розуміти контекст екрана.
Apple представила ReALM, нову модель, яка «бачить» і розуміє контекст екрана
Дослідники Apple представили ReALM, нову модель, яка може «бачити» та розуміти контекст екрана.
Anthropic дослідив багатоспробний джейлбрейк
Нещодавні викриття про техніку джейлбрейку з багатьма спробами пролили світло на критичний аспект великих мовних моделей, який створює потенційні ризики у сфері ШІ. Дослідження Anthropic щодо цього методу злому та його наслідків є одночасно інформативними та тривожними.
14 книжок про галузь штучного інтелекту, які варто прочитати у 2024 році
Запуск ChatGPT був не просто сплеском, це була хвиля, яка відкрила епоху генеративного ШІ.
SambaNova анонсувала Samba-CoE v0.2, яка перевершує конкурентів
Компанія SambaNova Systems, виробник ШІ-чіпів, представила нову велику мовну модель (LLM) Samba-CoE v0.2.
Кількість зломів внутрішніх чат-ботів зі ШІ за допомогою ASCII-арту зростає
Зростання внутрішніх загроз, спрямованих на чат-ботів зі штучним інтелектом, виявило вразливі місця в існуючих заходах безпеки. Одне з останніх відкриттів, ArtPrompt, показує, як зловмисники можуть використовувати обмеження великих мовних моделей (LLM), використовуючи ASCII-арт задля обходу заходів безпеки.
Databricks відкриває доступ до DBRX, потужної мовної моделі для підприємств
Databricks оголосила про випуск DBRX, сучасної великої мовної моделі, що перевершує відомі аналоги з відкритим кодом у багатьох тестах.
АІ Sakana відкриває нові архітектури для генеративних моделей
Японський стартап Sakana AI, що базується в Токіо, розробив нову методику під назвою Evolutionary Model Merge для автоматичного створення генеративних моделей. Цей підхід натхненний природним відбором і полягає в об'єднанні частин існуючих моделей для створення більш ефективних.
ШІ-бот «Syntax» може допомогти не-кодувальникам створювати додатки для Ethereum
Spectral Labs представила Syntax — інноваційний додаток, який може допомогти будь-кому, навіть без досвіду програмування, створювати смартконтракти для Ethereum та інших блокчейнів.
Як дослідники з UC Berkeley, ICSI та LBNL підвищують продуктивність великих мовних моделей
Методологія LLM2LLM, запропонована дослідницькою групою Каліфорнійського університету в Берклі, Інститутом корпоративних секретарів Індії та Національною лабораторією Лоуренса Берклі, пропонує новий підхід до розширення можливостей великих мовних моделей у сценаріях з низьким рівнем даних.
HuggingFace представив Quanto
Дослідники HuggingFace представили Quanto, бібліотеку Python, призначену для вирішення проблеми оптимізації моделей глибокого навчання для розгортання на пристроях з обмеженими ресурсами, таких як мобільні телефони та вбудовані системи.
Нова архітектура машинного навчання, натхненна мозком, для вдосконалення великих мовних моделей
Штучний інтелект стоїть перед важливим завданням: вдосконалити можливості великих мовних моделей (LLM), забезпечуючи при цьому їхню відповідність сучасним вимогам і точність. Традиційні методи, такі як перенавчання або точне налаштування, є ресурсомісткими і ризикують стерти цінну інформацію через швидке забування.
Google AI представляє Cappy, невелику модель машинного навчання, що робить LLM доступнішими
Дослідники Google AI представили нову модель машинного навчання Cappy, яка значно покращує та робить доступнішими багатозадачні мовні моделі (LLM).