22.02.2024 14:17
Поєднання хімії та ШІ за допомогою нової діалогової мовної моделі
Поява великих мовних моделей (LLM) призвела до змін у різних галузях, але галузь хімії давно чекала на модель, пристосовану до її унікальних викликів. ChemLLM — це новітня модель, розроблена спільною командою з відомих китайських інституцій. ChemLLM є першою великою мовною моделлю, що базується на діалогах, яка спеціально розроблена для хімії та враховує нюанси цієї наукової галузі.
Специфіка хімічної галузі пов’язана зі структурованістю даних, що зазвичай зберігаються в базах даних, які не підходять для звичайних діалогових мовних моделей LLM. ChemLLM долає цю перешкоду за допомогою власного методу побудови інструкцій на основі шаблонів, перетворюючи структуровані хімічні дані у формати, зручні для діалогу. Такий підхід забезпечує безперешкодну взаємодію, роблячи ChemLLM досвідченим учасником хімічного дискурсу.
Процес навчання моделі передбачає перетворення структурованих хімічних знань у діалогові формати, що дозволяє їй тренуватися на цих діалогах так, ніби це природні розмови. ChemLLM зберігає здатність обробляти складну хімічну інформацію та брати участь у послідовних дискусіях про хімію, тренуючись на великій базі даних, що охоплює завдання від прогнозування молекулярних властивостей до прогнозування реакцій.
За продуктивністю у виконанні основних хімічних завдань ChemLLM перевершує такі відомі моделі, як GPT-3.5 і GPT-4, демонструючи відмінні результати в перекладі назв, створенні підписів молекул і прогнозуванні реакцій. Глибоке розуміння хімічних принципів поширюється на суміжні задачі з математики та фізики, що підкреслює його універсальність.
У спеціалізованих завданнях обробки природної мови в хімії ChemLLM демонструє майстерність, починаючи від перекладу хімічної літератури і закінчуючи програмуванням в області хемінформатики. Ця майстерність позиціонує ChemLLM як надійного помічника для різних завдань, пов’язаних з хімією, пропонуючи розуміння, засноване на глибоких хімічних знаннях.
Рішення дослідницької групи зробити коди, набори даних і ваги моделей ChemLLM загальнодоступними заохочує подальші дослідження та інновації в застосуванні LLM до хімії. Ця відкритість полегшує прийняття та адаптацію ширшою науковою спільнотою, сприяючи співпраці та постійному вдосконаленню.
На закінчення, ChemLLM являє собою новаторське досягнення в поєднанні великих мовних моделей з хімією, що знаменує собою значний прогрес у застосуванні штучного інтелекту в спеціалізованих галузях. Її розробка заповнює важливу прогалину в середовищі великих мовних моделей для хімії і встановлює новий стандарт для мовних моделей для конкретних галузей. Ця спільна робота підкреслює потенціал міждисциплінарних досліджень у розширенні можливостей штучного інтелекту на користь розвитку науки.