Выкарыстанне сілы штучнага інтэлекту беларускімі даследчыкамі біямедыцынскіх выяў

  • Дата: 18/09/19
  • Падзяліцца:

Доктар Васіль Кавалёў з Аб’яднанага інстытута праблем інфарматыкі Нацыянальнай акадэміі навук Беларусі ведае ўсё пра важнасць супрацоўніцтва. Як кіраўнік аддзела біямедыцынскага аналізу выяў, ён і яго каманда выявілі, што толькі праз погляд вонкі яны могуць пераадолець перашкоды ў сваіх даследаваннях.

Доктар Кавалёў (на здымку вышэй) і яго каманда спецыялізуюцца на выкарыстанні тэхналогій біямедыцынскіга аналізу выяў і глыбіннага навучання ў медыцынскай дыягностыцы і лячэнні. Але выкарыстанне вялікіх аб’ёмаў персанальных медыцынскіх дадзеных, якія ўдзельнічаюць у навучанні глыбінных нейронных сетак (DNNs), паставіла перад навуковай супольнасцю шэраг этычных, прававых праблем, а таксама праблем бяспекі.

Вучоныя даследавалі два шляхі пераадолення гэтых выклікаў: распрацоўка адпаведных штучных дадзеных у выглядзе выяў, якія б нельга было адрозніць ад рэальных узораў, пры навучанні модуляў глыбіннага навучання; і павышэнне ўзроўню бяспекі для супрацьстаяння так званым «варожым нападам» на DNNs.

Такім чынам, каманда прыступіла да ўжывання метадаў глыбіннага навучання для вырашэння звычайных задач камп’ютарызаванай дыягностыкі захворванняў. У той жа час яны пачалі распрацоўваць новыя метады і праграмнае забеспячэнне для аўтаматычнай генерацыі штучных біямедыцынскіх выяў і вывучаць метады стварэння шкоданосных выяў, якія выкарыстоўваюцца ў варожых нападах, і адпаведных спосабаў абароны.

Стварэнне медыцынскіх выяў людзей, якіх не існуе

«У апошні час назіраецца велізарны прагрэс у новых, заснаваных на падыходах глыбіннага навучання, метадах аналізу і класіфікацыі выяў», —тлумачыць доктар Кавалёў. «Такія метады часта даюць вельмі добрыя вынікі. Але істотным недахопам з’яўляецца тое, што для навучання нейронных сетак яны выкарыстоўваюць вельмі вялікія калекцыі адпаведным чынам маркіраваных біямедыцынскіх выяў».

Гэтыя вялікія калекцыі, нават калі яны цалкам абязлічаныя, усё яшчэ сумнеўныя з пункту гледжання этыкі і бяспекі. Але Кавалёў і яго каманда знайшлі рашэнне. Яны прыдумалі метад, што выкарыстоўвае генератыўна-канкурэнтныя сеткі (GAN) для аўтаматычнага стварэння медыцынскіх выяў, якія можна было б выкарыстоўваць у якасці замены рэальных.

Пасля дасягнення высокай візуальнай якасці і адэкватных колькасных уласцівасцей, штучныя выявы могуць выкарыстоўвацца як для навучання мадэляў глыбіннага навучання, так і для адукацыйных і ілюстрацыйных мэт, каб гарантаваць якасць праграмнага забеспячэння. «Выкарыстоўваючы гэты падыход, — працягвае доктар Кавалёў, — навукоўцы маглі б свабодна праводзіць любыя даследаванні, заснаваныя на такіх штучных дадзеных».

Пакуль усё добра. Але даследаванне з генерацыяй выяў засноўвалася на вельмі вялікіх прыватных медыцынскіх базах дадзеных выяў з абмежаваным правам доступу. Яны ўключалі ў сябе базу дадзеных рэнтгенаграфіі грудной клеткі, якая змяшчае каля 2 000 000 першапачаткова лічбавых выяў, базу дадзеных 3D-кампутарнай тамаграфіі 10 000 пацыентаў і базу дадзеных гісталагічных выяў, якія выкарыстоўваюцца для дыягностыкі рака. Некаторыя слайды былі памерам у некалькі тэрабайт.

Усё гэта патрабавала высокай вылічальнай магутнасці, чаго беларускай камандзе вельмі не хапала. Так, навукоўцы  пачалі глядзець на іншую вобласць свайго даследавання — праблему бяспекі ў выкарыстанні тэхналогій біямедыцынскага аналізу выяў пры рэальным вызначэнні дыягназу.

Барацьба з «варожымі нападамі» Дык у чым жа была праблема? Даследчыкі сутыкнуліся з феноменам бяспекі — калі на арыгінальнай выяве зрабіць маленечкую мадыфікацыю, гэта можа прывесці да таго, што добра навучаныя DNN прымуць няправільнае рашэнне. У кантэксце працэсаў

медыцынскай дыягностыкі гэта вельмі небяспечная сітуацыя. Здаровы чалавек з крыху змененай выявай мог атрымаць вынікі, якія давалі падставу падазрэнням на рак. «Было эксперыментальна даказана, што практычна любую глыбінную нейронную сетку можна вымусіць прыняць няправільнае рашэнне», — тлумачыць доктар Кавалёў.

У выніку, беларускія даследчыкі правялі шэраг вылічальных эксперыментаў глыбіннага навучання для вывучэння ўразлівасці розных медыцынскіх выяў з мэтай абароны камп’ютарызаваных сістэм дыягностыкі захворванняў ад патэнцыйных нападаў шкоданосных медыцынскіх выяў.

І зноў яны сутыкнуліся з той жа перашкодай — бракам высокай вылічальнай магутнасці. Ім патрэбен быў доступ да HPC (высокапрадукцыйных вылічэнняў ці суперкамп’ютара).

І як жа яны атрымалі доступ да HPC?

У абодвух выпадках для працы з такім вялікім аб’ёмам дадзеных і выкарыстання найноўшых метадаў аналізу выяў і праграмнага забеспячэння камандзе патрабаваліся вельмі магутныя вылічальныя рэсурсы.

«Мы хутка зразумелі, што было б вельмі важна аб’яднаць намаганні з іншымі даследчымі ўстановамі», — прызнаецца доктар Кавалёў. Навукоўцы падалі заяўку на ўдзел у праграме Enlighten Your Research (EYR), якая ажыццяўляецца ў рамках фінансаванага ЕС праекта «Усходняе партнёрства: сувязі» (EaPConnect). Гэты праект закліканы аб’яднаць даследчыкаў, навукоўцаў і студэнтаў з Арменіі, Азербайджана, Беларусі, Грузіі, Малдовы і Украіны, каб яны маглі супрацоўнічаць адзін з адным і сваімі калегамі па ўсім свеце, падлучаючыся праз высоканадзейныя сеткі вялікай ёмістасці і спецыялізаваныя анлайн-сэрвісы.

Заяўку каманды Кавалёва на EYR падтрымалі, і вынікі былі імгненныя. Перашкода ў выглядзе браку вылічальных магутнасцяў была пераадоленая. Каманда атрымала доступ да еўрапейскіх суперкам’ютарных рэсурсаў праз інфраструктуру, прадстаўленую беларускай нацыянальнай сеткай для навуковых даследаванняў і адукацыі BASNET і агульнаеўрапейскай сеткай для навуковых даследаванняў і адукацыі GÉANT.

Нарэшце каманда здолела працягнуць сваю працу. Цяпер навукоўцы могуць праводзіць большасць эксперыментаў і дзяліцца новымі ведамі і створанымі штучнымі выявамі з еўрапейскімі партнёрамі.

Гэтая гісторыя была ўпершыню апублікаваная праграмай EaP Connect.

Гісторыі поспеху

Паглядзець усё