24.09.2023 13:59

Google DeepMind зміг класифікувати наслідки 71 мільйона “неправильних” мутацій

Найважливіший виклик у генетиці людини, мабуть, пов’язаний зі складністю людського геному та широким розмаїттям генетичних факторів, що впливають на здоров’я і хвороби. Геном людини складається з понад 3 мільярдів пар основ, охоплюючи не лише гени, що кодують білки, але й некодуючі ділянки, життєво важливі для регуляції та функціонування генів. Розгадка процесів, що відбуваються в цих елементах, та їхніх складних взаємодій є монументальним завданням.

Ідентифікація генетичного варіанту, пов’язаного із захворюванням, є лише відправною точкою. Розуміння функціональних наслідків цих варіантів, їхньої взаємодії з іншими генами та їхньої ролі в патології захворювання є складним і ресурсномістким завданням. Аналіз величезних обсягів генетичних даних, отриманих за допомогою високопродуктивних технологій секвенування, вимагає передових обчислювальних інструментів та інфраструктури, що створює значні логістичні проблеми.

Дослідники з Google DeepMind вирішили цю проблему, створивши каталог за допомогою нещодавно розробленої моделі штучного інтелекту AlphaMissense. Цей каталог охоплює приблизно 89% з 71 мільйона можливих варіантів помилок, які класифікуються як патогенні або доброякісні. Помилкові варіанти — це генетичні мутації, що призводять до однонуклеотидних замін у послідовності ДНК. Нуклеотиди, фундаментальні одиниці ДНК, розташовані в певному порядку, кодуючи важливу генетичну інформацію та білкові структури в живих організмах. В середньому людина несе в собі понад 9000 міссенс-варіантів.

Класифікація варіантів міссенсів (точкових мутацій) допомагає зрозуміти, які саме зміни в білках призводять до виникнення хвороб. Модель AlphaMissense була навчена на даних їхньої попередньої успішної моделі AlphaFold, яка передбачала структуру майже всіх відомих білків на основі амінокислотних послідовностей. AlphaMissense оцінює послідовність білка та структурний контекст варіантів, щоб отримати оцінки від 0 до 1. Оцінка 1 вказує на високу ймовірність того, що структура є патогенною. На основі цих оцінок визначаються порогові значення для класифікації варіантів.

AlphaMissense перевершує інші обчислювальні методи і моделі, ставши найточнішим методом прогнозування лабораторних результатів, що відображає його узгодженість з різними підходами до вимірювання патогенності. Ця модель дозволяє користувачам отримувати попередній перегляд результатів для тисяч білків одночасно, допомагаючи у визначенні пріоритетів ресурсів і прискорюючи дослідження. З більш ніж 4 мільйонів варіантів міссенсів, що спостерігаються у людини, лише 2% були експертним чином анотовані як патогенні або доброякісні, що становить приблизно 0,1% від 71 мільйона потенційних варіантів міссенсів.

Важливо відзначити, що генетика людини — це галузь, яка постійно розвивається. Розвиток технологій, аналіз даних і наше розуміння генетичних механізмів продовжують вирішувати ці проблеми. Хоча ці перешкоди є величезними, вони також відкривають захоплюючі можливості для покращення здоров’я людини та персоналізованої медицини завдяки генетичним дослідженням, а також проливають світло на еволюційні уявлення шляхом розшифрування геномів різних організмів.