BTC$29880

ETH$3666

Шукати

#LLM

Вдосконалення точного налаштування великих мовних моделей для розв’язування математичних задач

Навіть найдосконаліші великі мовні моделі, такі як GPT-4 і PaLM 2, стикаються з проблемами, коли справа доходить до розв'язання математичних задач, що вимагають застосування творчої складової, математичних міркувань і обчислень.

Дослідники з Китаю розробили механізм корекції галюцинацій для моделей штучного інтелекту

Команда вчених з Китайського науково-технічного університету та лабораторії YouTu Lab компанії Tencent розробила інструмент, який може допомогти моделям штучного інтелекту (ШІ) уникати генерування неправдивої інформації, відомої як «галюцинації».

Досягнення неймовірних результатів за допомогою шумових вбудовувань NEFTune

Цей метод має багато переваг, зокрема покращує інтерпретацію, зменшує упередженість та підвищує ефективність виконання завдань. Важливість точного налаштування інструкцій для реалізації повного потенціалу LLM неможливо переоцінити, що робить цей процес надзвичайно важливим.

Нова безтренувальна та теоретико-ігрова процедура ШІ для декодування мовних моделей

Деякі завдання, пов'язані зі створенням або перевіркою фактичних тверджень, такі як відповіді на запитання, перевірка фактів і генерація безумовного тексту, досить добре виконуються сучасними мовними моделями.

Сила пасльону покарає ШІ за вилучення даних без дозволу

Цей інструмент працює, тонко модифікуючи цифрові зображення, щоб забруднити набори даних, які використовуються для навчання ШІ. Ці зміни настільки тонкі, що обманюють системи штучного інтелекту, змушуючи їх неправильно інтерпретувати зображення.

Дослідження показало, що ChatGPT може вгадувати секрети, якими ви ніколи не ділитеся

Занепокоєння щодо конфіденційності в таких сервісах штучного інтелекту, як ChatGPT та його конкурентах, викликає не потенційний ШІ-апокаліпсис, про який попереджають деякі експерти. Стурбованість зумовлена не тим, що технологічні гіганти зловживають великими мовними моделями для збору особистої інформації з метою отримання прибутку від реклами.

Точне налаштування ШІ в 10 разів зменшує кількість параметрів, що піддаються навчанню

Оскільки сфера застосування програм обробки природної мови продовжує розширюватися, зростає попит на моделі, здатні розуміти і діяти відповідно до конкретних інструкцій з мінімальними обчислювальними ресурсами і пам'яттю. Це дослідження розглядає обмеження існуючих методів і представляє новий підхід під назвою VeRA, покликаний значно покращити процеси налаштування інструкцій.

Anthropic створила демократичного чат-бота зі штучним інтелектом, дозволивши користувачам голосувати за його цінності

Компанія Anthropic розробила першу у своєму роді велику мовну модель (LLM), яка була налаштована з урахуванням оціночних суджень спільноти її користувачів.