BTC$29880

ETH$3666

Шукати

#ШІ

Поглиблений аналіз відтворюваності та оптимізації в малих масштабах

Нещодавній прорив у галузі штучного інтелекту, пов'язаний з масштабуванням моделей трансформерів, відкриває нові можливості в різних додатках, таких як чат-боти та генерація зображень. Хоча ці великі трансформантні моделі здобули величезну популярність і увагу, дослідники зіткнулися з проблемами, пов'язаними зі стабільністю навчання.

Як ШІ та Інтернет речей можуть сприяти розвитку розумних міст у майбутньому?

Розумні міста є наступним етапом розвитку Інтернету речей (Internet of Things, IoT), де взаємопов'язана інфраструктура, від паркоматів до вуличних ліхтарів і автобусних зупинок, може підвищити міську безпеку та зручність.

Глибоке навчання в оптичній метрології

Паливні елементи є перспективним джерелом чистої енергії, але їхня поверхня може страждати від мікродефектів, які впливають на ефективність. Виявлення цих дефектів традиційно передбачає використання растрової електронної мікроскопії, але дослідники з Корейського науково-дослідного інституту стандартів і науки розробили рішення, що базується на глибокому навчанні.

Joule: генеративний ШІ-помічник для бізнес-додатків

Компанія SAP SE представила свою нову розробку під назвою Joule - генеративний штучний інтелект на основі природної мови, який має на меті трансформувати бізнес-операції. Інтегрований у хмарне корпоративне портфоліо SAP, Joule пропонує проактивну та контекстну інформацію з різних рішень SAP та сторонніх джерел.

Як заборонити Google Bard зберігати ваші дані та місцезнаходження

Останнє оновлення Google Bard дозволяє йому заглиблюватися у ваші Google Docs, знаходити старі повідомлення Gmail і переглядати всі відео на YouTube. Однак перед тим, як повністю дослідити нові розширення для цього чат-бота, важливо зрозуміти, як захистити свою конфіденційність і які існують обмеження.

InternLM-20B: 20-мільярдний ШІ фреймворк з відкритим вихідним кодом

У галузі обробки природної мови, що стрімко розвивається, дослідники постійно прагнуть розробити моделі, здатні розуміти, міркувати та генерувати текст, як людина. Ці моделі повинні враховувати складні лінгвістичні нюанси, заповнювати мовні прогалини та адаптуватися до різноманітних завдань.

Як спрощений компонент оптичної нейронної мережі економить простір та енергію

У сфері оптичних обчислень ключовою проблемою є ефективна реалізація оптичного матрично-векторного множення дійсних чисел (Matrix-Vector Multiplication, MVM). Хоча оптичні обчислення мають такі переваги, як висока пропускна здатність, низька затримка та енергоефективність, традиційні методи оптичних матричних обчислень були розроблені для матриць комплексних значень, що призводить до надлишковості ресурсів при обробці матриць дійсних значень.

Фреймворк ШІ для зміни ракурсу камери на об’єкті, маючи лише одне RGB-зображення

У сфері комп'ютерного зору дослідники зіткнулися з постійним викликом: зміна ракурсу об'єкта за наявності лише одного RGB-зображення. Ця складна проблема має широке розповсюдження в доповненій реальності, робототехніці та реставрації творів мистецтва. Попередні підходи, що спиралися на створені вручну особливості та геометричні припущення, не давали практичних рішень.

Стрибок до мультимодального навчання роботів з крос-модальним мисленням

Дослідники представили передовий фреймворк під назвою MUTEX, що розшифровується як "Мультимодальна специфікація завдань для виконання роботами". Цей фреймворк має на меті значно розширити можливості роботів у допомозі людям.

Як навчити спеціалізовану невелику модель машинного навчання з меншою кількістю даних

В останні роки великі мовні моделі (Large Language Models, LLM) трансформували обробку природної мови, уможлививши навчання з нульовою та малою кількістю кроків. Однак їхні високі обчислювальні вимоги, особливо моделей з мільярдами параметрів, обмежили їхню доступність для багатьох дослідницьких команд.

Домашні роботи з 3D-зором тепер розуміють складні мовні запити зі зменшеною залежністю від даних

Розуміння тривимірного середовища має вирішальне значення для домашніх роботів, оскільки дозволяє їм виконувати такі завдання, як навігація та відповіді на складні запитання. Однак сучасні методи часто не справляються зі складними мовними запитами і вимагають великих обсягів маркованих даних.

Quest 3, Meta та розумні окуляри Ray-Ban

Уявіть, що ви на музичному фестивалі або на дні народження, і ви хочете зафіксувати момент, не смикаючи телефон. Ось тут і з'являються ці розумні окуляри. Вони дозволяють знімати фото і відео з вашої точки зору, щоб ви могли по-справжньому пережити ці особливі моменти.