#LLM

Google DeepMind використав велику мовну модель для розв’язання математичної задачі

Google DeepMind використав велику мовну модель, щоб розв’язати відому нерозв’язну задачу чистої математики.

18.12.2023 10:08

Fetch.ai та SingularityNET об’єднуються, щоб боротися з галюцинаціями штучного інтелекту

Розробники Fetch.ai та SingularityNET оголосили про нове партнерство, спрямоване на боротьбу з галюцинаціями штучного інтелекту.

14.12.2023 18:06

Mistral AI випустила Mixtral, відкриту велику мовну модель, яка перевершує GPT 3.5

Паризький стартап Mistral AI випустив Mixtral, відкриту велику мовну модель (LLM), яка, за його словами, перевершує GPT 3.5 від OpenAI в декількох тестах, бувши при цьому набагато ефективнішою.

13.12.2023 11:16

ChatGPT вперше склав іспит з неврології

Нове дослідження продемонструвало вражаючі можливості нової великої мовної моделі (LLM) OpenAI — ChatGPT 4.0.

11.12.2023 18:55

Що таке LLM, LMM та MLM у машинному навчанні?

У величезному ландшафті машинного навчання архітектура моделей відіграє ключову роль у формуванні їхніх можливостей і застосувань. Серед безлічі структур три моделі виділяються своїми чіткими функціональними можливостями і широким застосуванням: модель великої мови, лінійна змішана модель і багатошарова модель.

30.11.2023 16:18

DeepMind представила векторні квантовані моделі

Нещодавні досягнення в галузі штучного інтелекту, машинного навчання і глибокого навчання помітно покращили різні сфери, такі як охорона здоров'я, фінанси та освіта.

29.11.2023 14:35

Дослідники з ETH Zurich створили хакерську атаку, яка обходить захист штучного інтелекту

Дует дослідників з Швейцарської вищої технічної школи Цюріха розробив метод, який теоретично може зламати будь-яку модель штучного інтелекту, залежну від зворотного зв'язку з людиною, включно з популярними великими мовними моделями.

28.11.2023 11:24

Мовна модель з відкритим вихідним кодом підвищує європейські можливості багатомовного ШІ

Розробка великих мовних моделей для європейських мов стикається з викликами через менший обсяг даних, ніж для англійської

25.11.2023 17:40

Новітній фреймворк для антропоморфних персонажів у великих мовних моделях

Дослідницька група з Університету Нанкай і компанії ByteDance представила ChatAnything — новий фреймворк для створення антропоморфних персонажів на базі великих мовних моделей (LLM) в онлайн-середовищі.

22.11.2023 17:38

Anthropic випускає Claude 2.1, який перевершує GPT-4 Turbo за масштабом і точністю

Компанія Anthropic, конкурент OpenAI, випустила нову версію своєї великої мовної моделі (LLM) Claude. Claude 2.1 має контекстне вікно на 200 000 лексем, що вдвічі більше, ніж у GPT-4 Turbo від OpenAI.

22.11.2023 10:21

Метод штучного інтелекту SOTA для виявлення тексту, згенерованого LLM

ChatGPT зробив справжню революцію у створенні вільних текстів на широке коло тем, але оцінка їхньої достовірності має вирішальне значення через потенційні помилки в фактах і галюцинації.

21.11.2023 15:17

Великий набір даних для синтетичного багатомовного пошуку з 28 мільйонами навчальних пар на 33 мовах

Дослідники з Google Research, Google DeepMind та Університету Ватерлоо представили SWIM-IR - навчальний набір даних для синтетичного пошуку, що охоплює 33 мови.

20.11.2023 15:28

Курси

Bitcoin

$18739

BTC

+3.68%

Etherium

$739

ETH

+3.68%

Etherium

$739

ETH

+3.68%

Etherium

$739

ETH

+3.68%

Etherium

$739

ETH

+3.68%

Etherium

$739

ETH

+3.68%

Etherium

$739

ETH

+3.68%

Теги

Приеднуйся