BTC$29880

ETH$3666

Шукати

#LLM

InternLM-20B: 20-мільярдний ШІ фреймворк з відкритим вихідним кодом

У галузі обробки природної мови, що стрімко розвивається, дослідники постійно прагнуть розробити моделі, здатні розуміти, міркувати та генерувати текст, як людина. Ці моделі повинні враховувати складні лінгвістичні нюанси, заповнювати мовні прогалини та адаптуватися до різноманітних завдань.

Компанія Mistral AI випустила нову потужну мовну модель з відкритим вихідним кодом

Паризька компанія Mistral AI випустила Mistral 7B, нову велику мовну модель з відкритим вихідним кодом (LLM). Модель має на меті забезпечити поєднання потужності та доступності, конкуруючи з більш відомими гравцями, такими як OpenAI ChatGPT, Claude AI та Google Bard.

Як навчити спеціалізовану невелику модель машинного навчання з меншою кількістю даних

В останні роки великі мовні моделі (Large Language Models, LLM) трансформували обробку природної мови, уможлививши навчання з нульовою та малою кількістю кроків. Однак їхні високі обчислювальні вимоги, особливо моделей з мільярдами параметрів, обмежили їхню доступність для багатьох дослідницьких команд.

Домашні роботи з 3D-зором тепер розуміють складні мовні запити зі зменшеною залежністю від даних

Розуміння тривимірного середовища має вирішальне значення для домашніх роботів, оскільки дозволяє їм виконувати такі завдання, як навігація та відповіді на складні запитання. Однак сучасні методи часто не справляються зі складними мовними запитами і вимагають великих обсягів маркованих даних.

Що таке об’єднання моделей?

Об'єднання моделей, яке часто називають ансамблевим навчанням, — це техніка в машинному навчанні та штучному інтелекті, коли кілька окремих моделей, кожна з яких призначена для певних завдань або проблем, об'єднуються в одну уніфіковану модель.

Дослідники Університету Цінхуа представили OpenChat

У сфері обробки природної мови (Natural Language Processing, NLP), що стрімко розвивається, можливості великих мовних моделей зростають в геометричній прогресії. Дослідники та організації постійно розширюють межі цих моделей, щоб покращити їхню продуктивність у різних завданнях NLP.

NExT-GPT: мультимодальна модель ШІ з відкритим вихідним кодом, яка може обійти текстових гігантів

NExT-GPT - це мультимодальна модель великої мови (LLM) з відкритим вихідним кодом, яка може обробляти і генерувати текст, зображення, аудіо та відео. Це означає, що вона може надавати більш природну взаємодію, ніж текстові моделі, такі як ChatGPT.

Bard анонсував інтеграцію з Gmail, Диском та іншими додатками Google

Bard, передова модель генеративного штучного інтелекту, представила свою найдосконалішу версію, яка обіцяє зробити революцію у співпраці та створенні контенту. Це оновлення включає в себе революційну інтеграцію з додатками та сервісами Google, так звані Bard Extensions, що дозволяє Bard безперешкодно отримувати та відображати інформацію з різних інструментів Google.

Нова технологія ШІ перетворює великі мовні моделі на інтерактивні діаграми в реальному часі

Великі мовні моделі, такі як ChatGPT, набули широкої популярності завдяки своїй здатності надавати інформацію та рішення користувачам у різних галузях. Однак їм притаманні певні обмеження, які в першу чергу випливають з лінійної та текстової природи їхньої взаємодії.

CulturaX: 6,3 трильйонів токенів на 167 мовах, пристосовано для розробки великої мовної моделі

Великі мовні моделі (Large Language Models, LLM) суттєво вплинули на дослідження та застосування обробки природної мови (Natural Language Processing, NLP), забезпечуючи найсучаснішу продуктивність у різних завданнях та відкриваючи нові можливості.

Нове велике оновлення DALL-E 3

OpenAI, впливовий гравець у галузі генеративного ШІ, представив DALL-E 3, останню версію свого генератора зображень. Ця оновлена ітерація в поєднанні з контролером ChatGPT здатна створювати високоякісні зображення у відповідь на підказки природною мовою. Варто зазначити, що OpenAI також вжив заходів для забезпечення етичного контролю.