
Google DeepMind використав велику мовну модель для розв’язання математичної задачі
Google DeepMind використав велику мовну модель, щоб розв’язати відому нерозв’язну задачу чистої математики.
Google DeepMind використав велику мовну модель для розв’язання математичної задачі
Google DeepMind використав велику мовну модель, щоб розв’язати відому нерозв’язну задачу чистої математики.
Fetch.ai та SingularityNET об’єднуються, щоб боротися з галюцинаціями штучного інтелекту
Розробники Fetch.ai та SingularityNET оголосили про нове партнерство, спрямоване на боротьбу з галюцинаціями штучного інтелекту.
Mistral AI випустила Mixtral, відкриту велику мовну модель, яка перевершує GPT 3.5
Паризький стартап Mistral AI випустив Mixtral, відкриту велику мовну модель (LLM), яка, за його словами, перевершує GPT 3.5 від OpenAI в декількох тестах, бувши при цьому набагато ефективнішою.
ChatGPT вперше склав іспит з неврології
Нове дослідження продемонструвало вражаючі можливості нової великої мовної моделі (LLM) OpenAI — ChatGPT 4.0.
Що таке LLM, LMM та MLM у машинному навчанні?
У величезному ландшафті машинного навчання архітектура моделей відіграє ключову роль у формуванні їхніх можливостей і застосувань. Серед безлічі структур три моделі виділяються своїми чіткими функціональними можливостями і широким застосуванням: модель великої мови, лінійна змішана модель і багатошарова модель.
DeepMind представила векторні квантовані моделі
Нещодавні досягнення в галузі штучного інтелекту, машинного навчання і глибокого навчання помітно покращили різні сфери, такі як охорона здоров'я, фінанси та освіта.
Дослідники з ETH Zurich створили хакерську атаку, яка обходить захист штучного інтелекту
Дует дослідників з Швейцарської вищої технічної школи Цюріха розробив метод, який теоретично може зламати будь-яку модель штучного інтелекту, залежну від зворотного зв'язку з людиною, включно з популярними великими мовними моделями.
Мовна модель з відкритим вихідним кодом підвищує європейські можливості багатомовного ШІ
Розробка великих мовних моделей для європейських мов стикається з викликами через менший обсяг даних, ніж для англійської
Новітній фреймворк для антропоморфних персонажів у великих мовних моделях
Дослідницька група з Університету Нанкай і компанії ByteDance представила ChatAnything — новий фреймворк для створення антропоморфних персонажів на базі великих мовних моделей (LLM) в онлайн-середовищі.
Anthropic випускає Claude 2.1, який перевершує GPT-4 Turbo за масштабом і точністю
Компанія Anthropic, конкурент OpenAI, випустила нову версію своєї великої мовної моделі (LLM) Claude. Claude 2.1 має контекстне вікно на 200 000 лексем, що вдвічі більше, ніж у GPT-4 Turbo від OpenAI.
Метод штучного інтелекту SOTA для виявлення тексту, згенерованого LLM
ChatGPT зробив справжню революцію у створенні вільних текстів на широке коло тем, але оцінка їхньої достовірності має вирішальне значення через потенційні помилки в фактах і галюцинації.
Великий набір даних для синтетичного багатомовного пошуку з 28 мільйонами навчальних пар на 33 мовах
Дослідники з Google Research, Google DeepMind та Університету Ватерлоо представили SWIM-IR - навчальний набір даних для синтетичного пошуку, що охоплює 33 мови.