BTC$29880

ETH$3666

Шукати

#Дослідження

Пекінський університет та Microsoft співпрацюють над створенням ефективних довгих контекстних вбудовувань

Спільними зусиллями Пекінського університету та Microsoft було представлено LongEmbed — метод розширення контекстного вікна вбудовування моделей до 32 000 токенів без перенавчання. LongEmbed унікально поєднує інтерполяцію позиції та RoPE для обробки довших текстових послідовностей, зберігаючи при цьому базову продуктивність на коротких вхідних даних.

Дослідження теоретичних основ та застосування дифузійних моделей в ШІ

Дифузійні моделі стали потужною альтернативою у сфері генеративного ШІ, продемонструвавши неабиякий успіх у різних галузях, таких як комп'ютерний зір, аудіосинтез, навчання з підкріпленням та обчислювальна біологія.

JetMoE-8B досягає рівня LLaMA2 і демократизує навчання та інновації в галузі ШІ

У сфері розвитку штучного інтелекту, де досягнення часто сприймаються як привілей технологічних гігантів зі значними фінансовими ресурсами, нещодавня співпраця між Лабораторією комп’ютерних наук і штучного інтелекту Массачусетського технологічного інституту (CSAIL) та Myshell AI спростувала це уявлення.

Розвиток Perplexity свідчить про кінець домінування Google

Інтеграція технології OpenAI в пошукову систему Bing від Microsoft і поява пошукової системи Google Search Generative Experience (SGE) викликали дискусії та занепокоєння в бізнес-спільнотах і спільнотах цифрового маркетингу щодо майбутнього вебтрафіку та пошукової оптимізації (SEO).

АІ Sakana відкриває нові архітектури для генеративних моделей

Японський стартап Sakana AI, що базується в Токіо, розробив нову методику під назвою Evolutionary Model Merge для автоматичного створення генеративних моделей. Цей підхід натхненний природним відбором і полягає в об'єднанні частин існуючих моделей для створення більш ефективних.

Як дослідники з UC Berkeley, ICSI та LBNL підвищують продуктивність великих мовних моделей

Методологія LLM2LLM, запропонована дослідницькою групою Каліфорнійського університету в Берклі, Інститутом корпоративних секретарів Індії та Національною лабораторією Лоуренса Берклі, пропонує новий підхід до розширення можливостей великих мовних моделей у сценаріях з низьким рівнем даних.

Із запуском Vision Pro компанії повинні почати говорити про нудоту від розширеної реальності

Аві Бар-Зів, ветеран у сфері віртуальної реальності (VR), який працює з 1990-х років, закликає компанії, що працюють у галузі розширеної реальності (XR), вирішити давню проблему, яка полягає у виникненні нудоти, спричиненої пристроями віртуальної та доповненої реальності.

Як вибіркове забування може допомогти ШІ краще навчатися

З впровадженням нового підходу групою комп'ютерних науковців спостерігається значний прогрес у галузі дослідження штучного інтелекту. Новий метод передбачає періодичне забування інформації, що зберігається в моделях машинного навчання, що призводить до підвищення гнучкості та адаптивності.

Ефективність та обмеження послідовного моделювання

Розуміння та генерування послідовностей, від мови до музики, стало однією з ключових задач штучного інтелекту. На цій арені панують трансформери, відомі своєю безпрецедентною здатністю фіксувати нюанси послідовних даних.

Інституціонали подвоюють використання штучного інтелекту в торгівлі — опитування JPMorgan

У світі трейдингу все більше уваги приділяється використанню штучного інтелекту (ШІ), зазначається у новому опитуванні JPMorgan. Згідно з цим дослідженням, яке об'єднало 4010 інституційних трейдерів з 65 країн, 61% з них вважають, що ШІ буде ключовою технологією для майбутнього трейдингу протягом наступних трьох років.