Штучний інтелект у генетичній діагностиці та персоналізованій медицині

За сучасними уявленнями особливості генетичної експресії, що зумовлюють розвиток патологічних станів, функціонально взаємопов’язані в межах єдиної мережі та формують специфічні модулі захворювань. Подібні модулі визначають систематику групування генів, засновану на їх взаємодії. Раніше здійснено декілька геномних модульних досліджень за напрямками різних захворювань з метою визначення специфіки модуля певної патології. Зазвичай подібні модулі представлено чисельним набором генів, і діагностичний скринінг ґрунтується на принципі геномної узгодженості, тобто модуль на основі експресії генів та білкових взаємодій може бути підтверджено шляхом зіставлення із взаємопов’язаними захворюваннями. Водночас подібні дослідження потребують знання мереж міжбілкових взаємодій для чіткої ідентифікації модулів, які за своєю природою є неповними, демонструють зміщення у напрямку деяких відомих генів, пов’язаних із певними захворюваннями, чи є результатом простих кореляційних генетичних досліджень.

Отже, модулі певних патологій на картах молекулярних взаємодій здатні характеризувати окремі захворювання. Але описова здатність біологічних мереж, які найчастіше визначають такі модулі, є недостатньо об’єктивною та вичерпною. Застосування можливостей штучних нейронних мереж нині є революційним підходом у системному аналізі та персоналізованій точній медицині. За наявності достатньої кількості даних перевагою штучних нейронних мереж у системному аналізі є здатність як відтворювати релевантні об’єкти із первинних даних, так і виявляти складні нелінійні зв’язки. У новій роботі, представленій науковцями відділу біоінформатики Лінчепінзького університету (Linköping University), Швеція, вивчено можливості ідентифікації модулів генів, що зумовлюють розвиток захворювань, без попереднього вивчення біологічної мережі, але спираючись на результати навчання штучного аутоенкодеру та обробки великого масиву транскрипційних даних. За результатами масштабного скринінгу первинних даних ідентифіковано закономірності експресії генів та виявлено окремі групи генів, пов’язаних із розвитком захворювань. Це дозволило авторам наукового проєкту висловити сподівання на те, що в найближчій перспективі новий метод стане однією з основ точної медицини та індивідуалізованого лікування. Стаття опублікована у виданні «Nature Communications» 12 лютого 2020 р.

Глибинне навчання штучних нейронних мереж

Донині основою картування мереж біологічної взаємодії слугували особливості взаємодії генів або білків. Метою нового дослідження став пошук можливостей ідентифікації біологічних мереж із залученням технології глибинного навчання штучного інтелекту. В описаних умовах об’єкти, відомі як штучні нейронні мережі, навчаються на основі експериментальних даних. Раніше можливості штучних нейромереж навчатися розпізнавати шаблони в надвеликих масивах складних даних успішно застосовувалися у сфері розпізнавання зображень. Водночас цей метод машинного навчання вкрай рідко застосовували в дослідженнях біологічного профілю. У представленому новому науковому проєкті метод глибинного навчання для пошуку зв’заних із розвитком захворювань генів було застосовано вперше.

Загалом у дослідженні здійснено аналіз масштабної бази даних з інформацією про патерни експресії 20 тис. генів. Первинні дані не сортували за принципом зв’язку тих чи інших шаблонів експресії генів із розвитком захворювань або відсутністю патологічних наслідків. Після цього здійснено власне навчання штучної нейронної мережі пошуку патернів експресії генів. Обговорюючи процес дослідження, автори наголосили на тому, що одним із недоліків такого пошукового методу є відсутність можливості спостерігати, яким чином штучний інтелект вирішує поставлене завдання, адже дослідники знають лише первинні дані та кінцевий результат їх опрацювання штучною нейромережею. Однак, аналізуючи створену нейронну мережу, автори виявили, що первинний рівень аналізу значною мірою представлено оцінкою взаємодії між різними протеїнами. Натомість глибші рівні аналізу пов’язані з описом взаємодій різних типів клітин. Таким чином, враховуючи відсутність первинного сортування даних генетичної експресії, зроблено висновок про те, що зазначений тип біологічно релевантного групування створюється автоматично.

В подальшому було вивчено можливості застосування подібної моделі експресії генів для визначення патернів генів, пов’язаних із захворюваннями та не залучених у розвиток патологічних станів. Доведено здатність моделі ідентифікувати відповідні патерни, які чітко узгоджуються з біологічними механізмами в організмі людини. Більше того, зважаючи на навчання моделі на основі первинних даних, які не сортували за патологічною ознакою, імовірність ідентифікації абсолютно нових закономірностей є досить високою. Нині дослідники планують вивчення питання відносно актуальності таких раніше невідомих моделей генетичної експресії безпосередньо з біологічного погляду.

Висновок та практичне застосування

Загалом автори представленої роботи зазначили, що основою інтенсивного розвитку цього напрямку досліджень і практичного впровадження є глибоке розуміння закономірностей функціонування нейронних мереж. Це може відкрити новий погляд на процеси біологічного контексту, зокрема розвиток захворювань, які є наслідком констеляції багатьох чинників. Крім того, представлений метод надає моделі, узагальнення яких спрощено, а це може бути застосовано для багатьох видів біологічної інформації.

Долучайтеся до нас у Viber-спільноті, Telegram-каналі, Instagram, на сторінці Facebook, а також Twitter, щоб першими отримувати найсвіжіші та найактуальніші новини зі світу медицини.

Dwivedi S.K., Tjärnberg A., Tegnér J. et al. (2020) Deriving disease modules from the compressed transcriptional space embedded in a deep autoencoder. Nat. Commun., Feb. 12. DOI: 10.1038/s41467-020-14666-6.
Linköping University (2020) Artificial intelligence finds disease-related genes. ScienceDaily, Feb. 13.

Наталія Савельєва-Кулик