15.02.2024 11:21
TAG-LLM: ШІ-інструмент для розшифровки складних білкових структур і хімічних сполук
TAG-LLM, розроблений у Microsoft Research, відкриває нові перспективи для застосування великих мовних моделей (LLM) у спеціалізованих галузях, таких як обчислювальна біологія і хімія. Зазвичай LLM добре справляються з різноманітними завданнями обробки природної мови, але мають обмеження в роботі зі складними областями, що містять спеціалізовану термінологію та структуровані дані, такі як білкові послідовності та хімічні сполуки. TAG-LLM вирішує це обмеження, використовуючи систему металінгвістичних тегів, які допомагають моделі адаптуватися до специфічних галузей.
TAG-LLM розкривається через ретельно структуровану методологію, що складається з трьох етапів. Спочатку на основі не контрольованих даних створюються доменні теги, що відображають знання про конкретну галузь. Потім ці теги збагачуються релевантною інформацією, що підвищує їхню корисність, і вводяться функціональні теги, спрямовані на вирішення конкретних завдань у відповідній галузі. Цей підхід надає моделі гнучкість і точність для роботи зі спеціалізованими даними.
TAG-LLM демонструє високу ефективність у вирішенні завдань, пов’язаних з білками, хімічними сполуками та лікарськими засобами. Порівняно з іншими моделями, TAG-LLM виявляється ефективнішим, що підкреслює його потенціал для революційних наукових відкриттів. Крім того, TAG-LLM відкриває нові можливості для використання ШІ в наукових дослідженнях, допомагаючи розширити межі можливого у важливих технічних галузях.
Розробка TAG-LLM є значним кроком у напрямку поєднання штучного інтелекту та наукових досліджень. Її унікальний підхід відкриває нові перспективи для наукових відкриттів і застосувань у різних галузях.
Нагадаємо, дослідницька група з Salesforce представила ProGen — модель штучного інтелекту, ретельно розроблену з метою створення білкових послідовностей з високою точністю.