18.12.2023 10:08
Google DeepMind використав велику мовну модель для розв’язання математичної задачі
Google DeepMind використав велику мовну модель, щоб розв’язати відому нерозв’язну задачу чистої математики. Дослідники стверджують, що це перший випадок, коли велика мовна модель була використана для пошуку рішення давньої наукової головоломки, що дозволило отримати нову цінну інформацію, яку можна перевірити, і яка раніше не існувала.
Новий інструмент FunSearch
Новий інструмент Google DeepMind під назвою FunSearch продовжує серію відкриттів у фундаментальній математиці та комп’ютерних науках, які DeepMind зробив за допомогою штучного інтелекту. FunSearch (названий так тому, що він шукає математичні функції, а не тому, що це весело) поєднує велику мовну модель під назвою Codey, версію PaLM 2 від Google, яка точно налаштована на комп’ютерний код, з іншими системами, які відкидають неправильні або безглузді відповіді, а правильні підставляють назад.
Як це працює?
Дослідники почали з того, що намалювали проблему, яку хотіли вирішити, популярною мовою програмування Python. Але вони пропустили рядки в програмі, які б вказували, як її вирішити. Саме тут і з’явився FunSearch. Він змушує Codey заповнити пропуски — фактично, запропонувати код, який розв’яже проблему.
Потім другий алгоритм перевіряє та оцінює те, що пропонує Codey. Найкращі пропозиції — навіть якщо вони ще не є правильними — зберігаються і повертаються назад до Codey, який намагається завершити програму знову.
Результати
Після кількох мільйонів пропозицій та кількох десятків повторень всього процесу — а це зайняло кілька днів — FunSearch зміг розробити код, який давав правильне і раніше невідоме розв’язання задачі про множину кришечок.
Це дуже вузька, але важлива задача. Математики навіть не можуть дійти згоди щодо того, як її розв’язати, не кажучи вже про те, що це за розв’язок. Теренс Тао, лауреат багатьох найвищих нагород у галузі математики, назвав задачу про набір ковпачків «можливо, моїм улюбленим відкритим питанням».
Перспективи
Ключова перевага FunSearch над AlphaTensor полягає в тому, що його теоретично можна використовувати для пошуку рішень широкого спектра проблем. Результати FunSearch також легше зрозуміти. Рецепт часто зрозуміліший, ніж дивне математичне рішення, яке він генерує.
Щоб перевірити його універсальність, дослідники використали FunSearch для вирішення ще однієї складної математичної задачі: задачі пакування контейнерів. FunSearch знайшов спосіб розв’язати цю задачу, який є швидшим, ніж ті, що були винайдені людиною.
За словами Тао, математики «все ще намагаються знайти найкращий спосіб включити великі мовні моделі в наш дослідницький робочий процес таким чином, щоб використати їхню силу, пом’якшивши при цьому їхні недоліки. Це, безумовно, вказує на один з можливих шляхів вперед».
Висновок
Результати дослідження Google DeepMind показують, що великі мовні моделі можуть бути використані для розв’язання математичних задач. FunSearch — це новий і багатообіцяльний інструмент, який має потенціал для подальших відкриттів у галузі математики та комп’ютерних наук.