BTC$29880

ETH$3666

Шукати

Нова модель, для безпомилкового прогнозування терапевтичного застосування в широкому діапазоні 17 080 захворювань

Існує нагальна потреба у створенні терапевтичних засобів для задоволення медичних потреб мільярдів людей у всьому світі. Проте, лише невелика частина клінічно визнаних хвороб наразі має дозволені методи лікування. Зміни у функціонуванні генів та молекул, які вони утворюють, є поширеними причинами хвороб. Ліки, які можуть відновити нормальну молекулярну активність, є потенційним захистом від цих хвороб. На жаль, терапевтичні підходи до відновлення біологічної активності пошкоджених генів все ще залишаються важкодоступними для багатьох розладів. Крім того, більшість хвороб спричинені змінами в багатьох генах, і люди можуть мати дуже різний набір мутацій навіть в межах одного гена. Інтерактоми, або мережі генів, які беруть участь у процесах і діях, пов’язаних із захворюваннями, є чудовим інструментом для пояснення цих генетичних подій. Щоб розшифрувати генетичну архітектуру, порушену при захворюванні, і допомогти у створенні ліків, спрямованих на неї, машинне навчання використовується для аналізу високопродуктивних молекулярних інтерактомів і даних електронних медичних записів.

Розробка нових ліків є складним завданням, особливо для хвороб з обмеженим вибором методів лікування, але вона може замінити неефективні ліки на безпечніші та ефективніші. FDA санкціонує лікування лише 500 із сотень людських хвороб. Лише 1 363 з 17 080 клінічно визнаних розладів, включених до аналізу, мали спеціально призначені для них ліки; з них 435 мали лише один рецепт, 182 – два, а 128 – три. Виявлення нових ліків має терапевтичне значення навіть для захворювань, які вже лікуються. Вони надають більше терапевтичних альтернатив з меншою кількістю побічних ефектів і замінюють невдалі препарати в певних групах пацієнтів.

TXGNN, геометричний метод глибокого навчання для прогнозування терапевтичного використання, впроваджується дослідниками, які цікавляться хворобами, що потребують більше знань про їхні молекулярні причини та потенційні методи лікування. TXGNN навчається за допомогою терапевтичного графа, на який нашаровуються мережі, збурені хворобами, які в даний час лікуються. Цей граф знань інтегрує та узагальнює десятиліття біологічних досліджень 17 080 поширених та рідкісних захворювань. Він оптимізований для відображення геометрії терапевтично-орієнтованого графа TXGNN. Модель графової нейронної мережі інтегрує терапевтичних кандидатів і хвороби в латентний простір представлення. TXGNN використовує модуль метричного навчання, який працює в латентному просторі представлення і може переносити модель TXGNN з хвороб, які спостерігаються під час навчання, на занедбані хвороби, щоб обійти обмеження контрольованого глибокого навчання в прогнозуванні терапевтичного використання для занедбаних хвороб.

TxGNN – це графова нейронна мережа, попередньо навчена на графі знань, що включає 17 080 клінічно визнаних розладів і 7 957 кандидатів на лікування. Вона може виконувати різні терапевтичні завдання в уніфікованому формулюванні. TxGNN дозволяє робити висновки з нуля на ненавчених захворюваннях, оскільки не потребує точного налаштування міток істинності або додаткових параметрів після навчання. Порівняно з сучасними підходами, TxGNN значно випереджає конкурентів, збільшуючи точність до 49,2% для завдань з визначенням показань і 35,1% для завдань з визначенням протипоказань.

Експериментальний дизайн і методологія – розбиття наборів даних для комплексної оцінки ефективності

  • Зона хвороби розщеплюється: Багато хвороб мають терапевтичний потенціал, але не мають ефективних методів лікування і майже не вивчені з біологічної точки зору. Потенціал TXGNN для прогнозування зв’язків між ліками та хворобами в таких випадках перевіряється шляхом моделювання добре вивчених захворювань так, ніби вони не мають молекулярної характеристики, використовуючи розбиття даних, розроблене дослідницькою групою. Спочатку хвороби групи та пов’язані з ними зв’язки “лікарський засіб – хвороба” копіюються до тестового набору. Це означає, що під час навчання TXGNN не помічає існування кордонів, що представляють поточні показання та протипоказання для обраної категорії захворювань. Це імітує складність лікування розладів з невідомими основними біологічними механізмами.
  • Розщеплення систематичних наборів даних: Прогнозування невиліковних хвороб має дуже добре підходити для моделі машинного навчання, що впроваджується. Набагато простіше передбачити потенційну терапію для хвороб, для яких наразі існує лікування, ніж для тих, для яких його немає. Дослідники розробили цей поділ, щоб ретельно вивчити здатність моделі прогнозувати раніше невідомі хвороби. Дослідники почали з того, що розділили всі хвороби навмання. Коли під час навчання не було розпізнано жодної терапії, а тестова множина складалася з унікальних захворювань, дослідники перенесли всі зв’язки між ліками та хворобами, пов’язані з тестовою множиною, на цю множину. Понад сто унікальних захворювань включаються в кожну ітерацію тестового набору.
  • Розщеплення наборів даних, орієнтованих на захворювання: Дослідники використовують оцінку, орієнтовану на захворювання, для моделювання того, як кандидати в ліки можуть бути використані в клініці. Спочатку дослідники пов’язують всі ліки в контрольній групі з усіма захворюваннями в тестовому наборі, виключаючи асоціації “лікарський засіб – хвороба” в навчальному наборі. Після цього дослідники оцінюють всі можливі пари на основі того, наскільки ймовірно, що вони взаємодіють між собою. Потім дослідники обчислюють частоту згадування, витягуючи найбільш популярні ліки (тобто, скільки ліків і хвороб у тестовому наборі є в повному наборі ). Останнім кроком є визначення випадкової базової лінії скринінгу, в якій випадковим чином відбираються найкращі зразки лікарських засобів з набору, і розраховується показник ризику відкликання.

Результати

  • Прогнозування терапевтичного застосування з використанням геометричних біологічних передумов у TXGNN. TXGNN базується на гіпотезі, що ліки, які націлені на порушені хворобою мережі в білкових взаємодіях, матимуть найбільші шанси на успіх. Оптимізована для відображення геометрії графа знань TXGNN, TXGNN – це заснована на знаннях GNN, яка відображає кандидатів на лікування і розлади (концепції захворювань) в латентному просторі представлення.
  • Використання еталонного TXGNN для прогнозування терапевтичного застосування з нуля. Дослідники тестують здатність TXGNN прогнозувати показання та протипоказання. Оскільки TXGNN призначений для лікування таких захворювань, як хвороба Штаргардта16 і гіпероксалурія, для яких наразі не існує методів лікування, його продуктивність вимірюється за допомогою метрики, яка називається “нульова продуктивність”, коли модель просять передбачити терапевтичне застосування для захворювань на окремому наборі даних, відомому як утриманий (тестовий) набір, який не був помічений під час навчання моделі.
  • 100% точність у прогнозуванні терапевтичного застосування для п’яти типів захворювань. Подібні методи лікування можуть застосовуватися для розладів, що мають схожу біологічну основу.
  • Неможливо спрогнозувати терапевтичне застосування для пацієнтів, які регулярно відмовляються від лікування.
  • 100% точність щодо 1 363 розладів, для яких є показання, і 1 195 станів, для яких є протипоказання.
  • Ретельний розгляд того, які методи лікування рекомендовані, а які протипоказані.
  • Порівняння прогнозів TXGNN з існуючими варіантами лікування. Дослідники розглянули 10 нових лікарських засобів, дозволених до застосування після завершення набору даних і розробки моделі TXGNN, щоб показати, що TXGNN не керується упередженістю підтвердження. У наборі даних TXGNN немає прямого зв’язку між лікарським засобом і хворобою. Після цього TXGNN попросили надати прогнози для дослідників.

Можливості

  • Щодо розладів, для яких не існує ліків, а наші молекулярні знання є недостатніми, TXGNN має “нульовий” прогнозний потенціал для терапевтичного використання.
  • Незважаючи на практичне обмеження, пов’язане з відсутністю ліків для певного стану і необхідністю екстраполяції на нову область захворювання, яка не спостерігалася під час навчання, TXGNN може значно покращити прогнозування терапевтичного застосування для різних розладів.
  • Крім того, прогнозована терапія TXGNN демонструє високий ступінь кореляції з даними з реальних електронних медичних записів, і її можна використовувати для перевірки великої кількості терапевтичних гіпотез одночасно, визначаючи когорти захворювань, яким призначали або не призначали певні ліки, використовуючи популяції пацієнтів, за якими спостерігали протягом декількох років.
  • Прогнози TXGNN були представлені групі лікарів, і аудиторія могла дізнатися більше про самопояснювальну модель, що використовується TXGNN для лікування хвороб. Важливість клініко-орієнтованого дизайну для переходу машинного навчання від розробки до біомедичного впровадження підкреслюють результати дослідження юзабіліті, які показують, що дослідники, які використовують інтерактивний TXGNN Explorer, можуть відтворювати моделі машинного навчання і легше виявляти і налагоджувати точки відмови моделей.