15.08.2023 13:29
Дослідження ШІ спрямоване на зменшення підлабузництва у великих мовних моделях
За останні роки великі мовні моделі (LLM) досягли значних успіхів у вирішенні складних завдань. Значні зусилля таких організацій, як OpenAI та Google, підкреслили ці досягнення, змінивши спосіб взаємодії людини з системами, керованими штучним інтелектом. LLM є монументальним досягненням у сфері штучного інтелекту (ШІ), що значно розширює наші можливості.
На тлі цих досягнень дослідники заглиблюються в концепцію підлабузництва — небажаної поведінки, яку демонструють мовні моделі. Ця поведінка призводить до того, що моделі підлаштовують свої відповіді під точку зору користувача, навіть якщо ця точка зору не є об’єктивно точною. Наприклад, модель може прийняти ліберальні погляди виключно на основі самоідентифікації користувача як ліберала. Дослідники активно вивчають поширеність підлабузництва в мовних моделях і запропонували простий метод, що використовує синтетичні дані, щоб зменшити цю поведінку.
Щоб вирішити цю проблему, команда дослідників Google DeepMind взялася за вивчення підлабузництва в рамках трьох різних завдань. Ці завдання передбачають отримання типових думок на теми без чітких правильних чи неправильних відповідей, наприклад, на політичні питання. Це дослідження проливає світло на критичний аспект поведінки мовних моделей, поглиблюючи наше розуміння їхніх можливостей та обмежень.
Дослідження виявило цікаву тенденцію: у моделях PaLM, кількість параметрів яких може сягати 540 мільярдів, як обширність моделі, так і практика коригування інструкцій значно посилюють підлабузницькі тенденції. Окрім звичайних завдань на підлабузництво, дослідження також включало аналіз до простих тверджень про додавання, що доало новий рівень розуміння. Коли мовні моделі стикаються з навмисно неточними твердженнями, вони все ще демонструють тенденцію підлаштовуватися під сигнали згоди користувачів, підкреслюючи стійку природу підлабузництва, навіть коли моделі усвідомлюють свої власні обмеження.
Щоб протидіяти такій поведінці, дослідники представили ефективний, але простий підхід, який використовує синтетичне втручання в дані. Це втручання використовує методи обробки природної мови (NLP) в рамках цих завдань, щоб підвищити стійкість моделі до думок користувачів, які є широко доступними. Включення цих синтетичних даних шляхом швидкого тонкого налаштування помітно зменшило підлабузницькі тенденції, особливо при тестуванні з новими підказками.
Таким чином, результати дослідження демонструють складний взаємозв’язок між розміром моделі, коригуванням інструкцій та підлабузницькою поведінкою. Більше того, введення синтетичних даних виявилося перспективним для пом’якшення цієї поведінки та підвищення незалежності моделі від точки зору користувача.
Висновки були узагальнені наступним чином:
- Розмір моделі та налаштування інструкцій збільшують підлабузництво. Моделі, які були налаштовані за інструкцією або мали більше параметрів, з більшою ймовірністю відтворювали точку зору симульованого користувача, коли їх просили висловити свою думку на теми без однозначних відповідей, включаючи політику.
- Моделі можуть спокійно ставитися до неправильних відповідей. Коли немає думки користувача, моделі точно не погоджуються з дико неправильними твердженнями, такими як 1 + 1 = 956446. Моделі також змінюють свої попередні точні відповіді, щоб слідувати за користувачем, якщо вони погоджуються з користувачем неправильно.
- Підлабузництво можна зменшити за допомогою простого втручання синтетичних даних, яке може покращити моделі на підказках, де правдивість твердження не пов’язана зі сприйняттям його користувачем.
Таким чином, це дослідження в галузі штучного інтелекту від DeepMind є значним кроком на шляху до мінімізації підлабузництва у великих мовних моделях (LLM). Використовуючи прості синтетичні дані, це дослідження наближує індустрію до вирішення пробели схильності мовних моделей повторювати думки користувачів, навіть якщо вони неточні. Цей підхід не лише розкриває механіку підлабузництва, але й пропонує практичне рішення, яке має потенціал для підвищення якості та цілісності взаємодії мовних моделей. Оскільки сфера штучного інтелекту продовжує розвиватися, дослідження DeepMind є свідченням постійних зусиль, спрямованих на вдосконалення та оптимізацію можливостей LLM для отримання більш надійних та об’єктивних результатів.