Skip Navigation Links наука
освіта
техніка
прогрес
Газета заснована у квітні 1997 р.
Пропустити посилання переходів
Випуски газети
Окремі статті
Фотогалерея
Редакція
Пропустити посилання переходів
Окремі статті 2020 року
Окремі статті 2018 року
Окремі статі 2017 року
Окремі статті 2016 року
Окремі статті 2015 року
Окремі статті 2014 року
Окремі статті 2013 року
Окремі статті 2012 рокуExpand Окремі статті 2012 року
Окремі статті 2011 року
Окремі статті 2010 року
Окремі статті 2009 року
Європейська хмара відкритої науки як глобальний інструмент наукових досліджень 
 
 

Добігає кінця Рамкова про­гра­ма з досліджень та інно­вацій Євро­пейсь­кого Со­юзу «Го­ризонт 2020». 2021 року роз­поч­неться нова про­гра­ма – «Го­ризонт Євро­па», для вхо­д­жен­ня до якої Ук­раїні вже вар­то роз­гор­тати роботу. Се­ред головних завдань, які сто­ять перед нашою країною на цьо­му шляху, – роз­ширен­ня представництва в Євро­пейсь­кому дослідниць­кому про­сторі (European Research Area, ERA), зок­рема долучен­ня до Відкритої хма­ри євро­пейсь­кої науки (European Open Science Cloud, EOSC). Про те, навіщо створювалась EOSC і які мож­ливості вона відкриває перед дослідни­ками з різних країн, ми поспілку­валися з віцепре­зиден­том Національ­ної ака­демії наук Ук­раїни, дирек­тором Інституту тео­ретич­ної фізики імені М.М. Бо­голюбова НАН Ук­раїни ака­деміком Анатолієм ЗАГОРОДНІМ.

Анатолію Глібовичу, більшість роз­мов із науковцями сьо­годні зво­дяться до теми COVID-19, що зро­зуміло. Пропоную поговорити про стратегічні питан­ня у науці, які ста­нуть ключовими після пан­демії. Скажімо, нещодав­но Євро­пейсь­кий Со­юз оприлюд­нив план дій «ERA про­ти CORONA», пункт 9 якого сто­сується інстру­ментів для обміну даними досліджень, а серед іншо­го – Євро­пейсь­кої хма­ри відкритої науки та принципів FAIR для даних, моделей, робочих про­цесів і результатів. По­ясність, будь лас­ка, що мається на увазі.

– Ми живемо в дуже цікавий час, коли одночас­но відбу­ваються май­же про­тилежні про­цеси. З одного боку, країни переорієнту­ють інтернаціональні лан­цюж­ки вироб­ництва товарів на національ­ний рівень. З іншо­го боку, вик­лики, що поста­ють перед суспільством, потре­бують відкрит­тя досліджень і залучен­ня гло­бального науко­вого та про­мис­лового ресур­су для їх подолан­ня. Крім того, каран­тин вплинув на занурен­ня гро­мадянсь­ких суспільств у вірту­аль­не середовище, яке за виз­начен­ням є відкритим і гло­бальним. Пандемія сти­мулювала спільні дії урядів та спо­нукала наукові співто­вариства до інтенсифікації досліджень нового коронавірусу. Це було б немож­ливо без відкритості досліджень, екс­перимен­тальних даних, циф­рових ресурсів, необхідних для оброб­ки даних, та про­грамних платформ для про­веден­ня досліджень, створених на основі відкритого коду.

Ці платфор­ми, на яких зберігаються дані попередніх досліджень, будувалися за бюд­жетні кош­ти багатьох країн світу (зок­рема у межах уже зга­даної про­гра­ми «Го­ризонт 2020») і нарешті отримали потуж­ний запит на їх викорис­тан­ня.

COVID-19 також при­вер­нув ува­гу до відсутності відтворюваності великої кількості даних досліджень, які почали відкриватися для усу­нен­ня загроз жит­тю і здо­ров’ю людей. Це питан­ня порушувалось і раніше, але не сприй­малось настільки гос­тро. На­при­клад, 2012 року з’явилась інформація про від­тво­рюваність даних біохіміч­них досліджень, на яких ґрун­тувалися результати, що ввійшли до науко­вих публікацій. Бу­ло встанов­лено, що половина даних не відтворюються і, фак­тич­но, є «хижацькими». Інше дослідження показало, що 80% ста­тей не мають посилан­ня на дані досліджень, до яких потенційно є доступ. Са­ме ці фак­ти взяли до ува­ги екс­пер­ти най­вищого рів­ня, які почали проєкту­вати EOSC. Во­ни дійшли до вис­нов­ку, що пов’язані з цими негараз­дами потенційні втрати бюд­жету ЄС на дослід­жен­ня – а це загалом близь­ко 120 млрд. євро – можуть бути значними. Ці оцінки ста­ли основою для започат­куван­ня проєкту OpenAIR – репозитарію відкритих даних, про­грамних платформ і публікацій, які мали зберігати учасники проєктів про­гра­ми «Го­ризонт 2020» і забез­печувати дотри­ман­ня принципів FAIR. Хо­тів би корот­ко пояс­нити, що це таке.

Дослідниць­ку інфрас­т­рук­туру складають облад­нан­ня та при­лади для про­веден­ня досліджень за пев­ним науко­вим напрямом. До­недав­на циф­рові інфрас­т­рук­тури для досліджень (або е-інфрас­т­рук­тури), які включають обчис­лювальні ресур­си для оброб­ки й отриман­ня нових даних відокремлювали вве­ден­ня ресурсів для збе­режен­ня даних та каналів передачі даних у будь-які куточ­ки світу. Су­часні тен­денції поєднання великих дослід­ницьких інфрас­т­рук­тур з е-інфрас­т­рук­турами для збе­режен­ня, оброб­лен­ня й відда­леного досту­пу до екс­перимен­тальних даних при­зво­дять до того, що дослідни­ки абстрагуються від такої інфрас­т­рук­тури й інфрас­т­рук­турою для них ста­ють самі дані. Дані удо­с­туп­нюються не лише для людей, а й для машин, комп’ютерів, про­грамних платформ, як­що вони відкриті для викорис­тан­ня та відповідають пев­ним стандар­там, зок­рема FAIR. FAIR – це принципи, яким мають відпо­відати дані та метадані (опис даних), аби забез­печувати лег­кий пошук наяв­них даних (Findable), надавати до них доступ (Accessible), бути інте­роперабельними, тоб­то сумісни­ми для спільного викорис­тан­ня (Interoperable), та допус­кати їх багаторазове викорис­тан­ня, тоб­то мати доступні ліцензії для цьо­го (Reusable). Інфрас­т­рук­турою таких відкритих даних і є EOSC – Євро­пейсь­ка хма­ра відкритої науки. Хмарою тут називають тех­нологію, яку викорис­товують зде­більшого для спільних інстру­ментів з оброб­лен­ня даних. Цей інстру­мент не є виключ­но євро­пейсь­ким – пер­шою ана­логіч­ною інфрас­т­рук­турою даних ста­ла інфрас­т­рук­тура Націо­нального інституту здо­ров’я США. За зразком EOSС зараз роз­будовуються Ав­стралійська й Аф­рикансь­ка хма­ри відкритої науки. Японія ж вирішила долучити свою національ­ну інфрас­т­рук­туру даних до євро­пейсь­кої. До речі, EOSC є складовою трьох різних політик ЄС – Стра­тегії циф­рового єдиного рин­ку та Євро­пейсь­кої хмарної ініціати­ви, Євро­пейсь­кого дослідниць­кого про­сто­ру, Ци­ф­ровізації про­мис­ловості. Крім того, кон­цепція EOSC охоплює не тільки тех­нологічну інфрас­т­рук­туру, а й є час­тиною Відкритої науки в Європі – від інфрас­т­рук­тур і даних до послуг і навичок, які мають сприяти створен­ню кон­курен­тос­про­мож­ної еко­номіки даних і знань у гло­бальному світі. За­галом політика EOSC зосеред­жується нині на чотирьох важ­ливих для інте­роперабельності еле­мен­тах – даних, навич­ках, сервісах та інфраструк­турі.

Варто заува­жити, що будь-яка дослідниць­ка інфрас­т­рук­тура, особливо гло­бальна, виникає на запит уче­них, урядів і спільнот, які шукають від­повідей на новопос­талі вик­лики. Першими це питан­ня поста­вили на порядок ден­ний дослідни­ки, які зай­малися фізикою високих енергій та пошуком бозону Хіггса. Під ці завдання було не лише збу­довано унікальний Ве­ликий адрон­ний колай­дер (ВАК), а й створено грід-інфрас­т­рук­туру для моделюван­ня екс­периментів, оброб­лен­ня даних, яка охо­пила вче­них, ІТ-фахівців, інно­ваторів, бізнес і гро­мадян практич­но з усіх країн. Після Кремнієвої долини – як інно­ваційно­го локального кла­с­теру світового рівня – ЦЕРН став при­кла­дом інно­ваційно­го про­риву на основі гло­бальної циф­ровізації науко­вих про­цесів та створен­ня роз­поділеної світової відкритої інно­ваційної еко­сис­теми, яка забез­печила швидкий обмін даними, їх оброб­ку на основі відкритого коду, гло­бального співробітництва, залучен­ня ІТ-спеціалістів і уможливила наукові відкрит­тя світового рівня. А завдяки відкритому обміну результатів досліджень було усу­нуто перешко­ди й затримки на шляху їх перевірки. На­ступного разу принципи Відкритої науки тес­тувалися на практиці під час спа­лаху лихоман­ки Ебола. Близько пів тисячі вче­них з усь­о­го світу відкрили тоді для обміну й викорис­тан­ня необроб­лені дані своїх дослід­жень.

– А чи може EOSC при­ско­рити створен­ня ліків про­ти COVID-19?

– Євро­пейсь­ка Комісія вва­жає, що EOSC – це ідеаль­ний інстру­мент для реа­гуван­ня на над­зви­чайні ситуації на кшталт пан­демій вірус­них інфекцій. Раніше перевагами гло­бального генеруван­ня й обміну даними уже ско­рис­тались астро­номія та фізика високих енергій, тепер це доступно і для біохімічних досліджень.

У лютому 2020 року з’явилася публікація, в якій аналізувалися дані досліджень коронавірусу SARS-CoV-2 чотир­ма гру­пами вче­них і було зроблено вис­новок про немож­ливість відтворювати дані досліджень у трьох випад­ках із чотирьох, тоб­то результати досліджень вик­ликали недовіру. Подібні випад­ки дуже перешко­д­жають гло­бальній науковій співпраці, що є важ­ливою для подолан­ня над­зви­чай­них ситуацій у сфері охо­рони здо­ров’я та потре­бує без­перешкодного досту­пу до даних, інстру­ментів аналізу й обчис­лювальної інфрас­т­рук­тури. Стрім­ке поширен­ня нового коронавірусу вка­зує на необхідність відкритого аналітич­ного середовища, яке дає гло­бальному дослідниць­кому співто­вариству змо­гу спільно роз­роб­ляти ефективні контр­заходи. 

Для усу­нен­ня цих недоліків і створен­ня відкритої платфор­ми для боротьби з над­зви­чай­ними ситуаціями про­тягом останніх десяти років з’явилися відкриті про­грамні забез­печен­ня для аналізу біохімічних даних, а значні національні кош­ти інве­с­тувались у науко­ву обчис­лювальну інфрас­т­рук­туру. Водночас, спа­лахи інфекційних захво­рювань час­то трапляються в місцях, де інфрас­т­рук­тура, необхідна для аналізу даних, може бути недоступною, а неупе­ред­жена інтерпре­тація результатів – політич­но неспромож­ною. Тож існує потре­ба у забез­печенні вільного обміну даними та досту­пу до надійних аналітич­них засобів їх аналізу. Ос­танні дослідження доводять, що аналізувати геном вірусу мож­на із засто­суван­ням відкритої світової науко­вої інфрас­т­рук­тури, повністю покла­даючись на про­грамне забез­печен­ня з відкритим кодом.

– Які мож­ливості EOSC про­понує корис­тувачам?

– EOSC – це вірту­аль­не середовище з відкритими та без­перервними сервісами зберіган­ня, управління, аналізу та повторного викорис­тан­ня даних досліджень незалеж­но від кор­донів і науко­вих дис­циплін. Во­но створюється шляхом об’єд­нан­ня наяв­них і нових інфрас­т­рук­тур науко­вих даних за дис­циплінами та країнами. Хмара є децен­т­ралізованою сис­темою, що ґрун­тується на співпраці та координації і забез­печує ком­біноване викорис­тан­ня наяв­них циф­рових інфрас­т­рук­тур, які реалізують принципи FAIR для обміну даними та принципи спільного викорис­тан­ня про­грамного забез­печен­ня на всіх ета­пах життєвого цик­лу досліджень.

Формуван­ня EOSC відбу­вається з позиції швидкого старту, а саме інте­роперабельності наяв­них е-інфрас­т­рук­тур і дослід­ницьких інфрас­т­рук­тур, які мають власні е-інфрас­т­рук­тури. Розбудова Євро­пейсь­кої інфрас­т­рук­тури даних має ста­ти базою для високопро­дук­тив­них обчис­лень над­високого рівня та для сервісів EOSC, які існу­ють уже зараз: EGI, EUDAT, Open AIRE, Indigo Data Cloud, Helix Nebula, PRACE, GEANT.

– Чи замінить EOSC такі інфрас­т­рук­тури, як, напри­клад, Ук­раїнська чи Євро­пейсь­ка грід-інфрас­т­рук­тура?

– На­впа­ки, вона викорис­товуватиме наявні інфрас­т­рук­тури та даватиме корис­тувачам змо­гу пра­цювати у кількох еко­сис­темах завдяки сумісності складових сис­тем EOSC. Для корис­тувачів EOSC ста­не точ­кою вхо­ду для пошуку, досту­пу й викорис­тан­ня послуг із різних дослідниць­ких інфрас­т­рук­тур. Во­на виз­начатиме шляхи без­перебійно­го об’єдна­ного викорис­тан­ня послуг різних інфраструк­тур для обміну даними, об’єднає ресур­си національ­них центрів оброб­ки даних, євро­пейсь­ких дослідниць­ких інфрас­т­рук­тур і е-інфрас­т­рук­тур. Очікується, що такі інфрас­т­рук­тури та національні хма­ри відкритої науки посту­пово увійдуть до федерації EOSC на доб­ровільних засадах, про­понуючи залучен­ня власних ресурсів та дотри­муючись встанов­лених пра­вил. Причому ступінь участі у федерації, тоб­то набори даних і послуг, які надаватимуться до EOSC, вони виз­начатимуть самостійно. Об­сяг цих ресурсів може місти­ти технічні послу­ги, а саме – аналітичні й обчис­лювальні послу­ги, хмарні сервіси, тематичні послу­ги, налаш­товані на кон­кретні наукові дис­цип­ліни, е-інфрас­т­рук­туру та сервіс проміжно­го про­грамного забез­печен­ня, управління іден­тифікацією досту­пу. На додачу, до хма­ри увійдуть ресур­си знань (передусім набори даних, схо­вище даних, циф­рові бібліоте­ки й архіви), сервіси досту­пу (каталог сервісів і пор­тали), наукові інстру­мен­ти та засоби, а також тренінги, підтрим­ка роз­роб­ки про­грамного забез­печен­ня та кон­сультації.

– Чи буде EOSC регулятив­ним органом?

– Ні, вона не є органом управ­ління, засновником чи між­народ­ною організацією. На­разі роз­глядається питан­ня створен­ня партнер­ства, яке підтримуватиметься про­гра­мою «Го­ризонт Євро­па». З іншо­го боку, рекомен­дації щодо політики, які роз­роб­ляються Хмарою, при­зна­чені для груп зацікав­лених сторін EOSC – фінан­сових агенцій, міністерств, дослід­ницьких інфрас­т­рук­тур і дослідниць­ких організацій. EOSC має органи управління й опе­ративні струк­тури, що роз­роб­люють і затверд­жують для неї стандар­ти та про­цедури, які засто­совуватимуться також до про­вай­дерів і корис­тувачів Хмари. Але повно­важень нав’язувати політику EOSC не має.

– Які переваги надає впровад­жен­ня EOSC?

– За оцінка­ми Євро­комісії, відкритий доступ до даних сприяє підви­щен­ню якості досліджень, зменшен­ню їх дуб­люван­ня, боротьбі з науко­вими шах­рай­ствами. А невпровад­жен­ня принципів FAIR для даних у 28-ми країнах ЄС обчис­люється сумою в 10,2 млрд євро в рік. Се­ред іншо­го, перехід до відкритої науки відкриває нові мож­ливості для при­ско­рен­ня фун­дамен­тальних досліджень, міждисциплінар­них дослід­жень і створен­ня про­рив­них інно­вацій. З метою налаш­туван­ня спе­цифічно­го ком­плексу сер­вісів для окремої спільноти з каталогу сервісів EOSC створюються роз­поділені цен­т­ри ком­петенції, в яких об’єдну­ються зусил­ля екс­пертів із дослід­ницьких і е-інфрас­т­рук­тур та роз­роб­ників тех­нологій. Хмари відкритої науки вже зараз роз­гор­таються, напри­клад, для потреб пла­нетології, матеріалознав­ства, при­род­ничих наук, клінічних досліджень, про­гно­с­тич­ної ток­сикології, сільського гос­подар­ства, захис­ту довкілля.

– Яким чином наша дер­жава, зок­рема, НАН Ук­раїни, інші наукові струк­тури бра­тимуть участь в EOSC?

– 2013 року було започат­ковано Цільо­ву ком­плекс­ну про­гра­му науко­вих досліджень НАН Ук­раїни «Грід-інфрас­т­рук­тура і грід-тех­нології для науко­вих і науко­во-при­кладних засто­сувань», в рам­ках якої пла­нується роз­вивати хмарні тех­нології, створити об’єдна­ну хма­ру Ук­раїнсько­го національ­ного гріду (УНГ) і забез­печити його сис­тем­не інте­г­руван­ня в Євро­пейсь­ку інфрас­т­рук­туру, включ­но з мережею супер­комп’ютерів PRACE, репозиторієм EUDAT, об’єдна­ною Євро­пейсь­кою хма­рою для науко­вих та інно­ваційних досліджень.

На жаль, 2016 року Ук­раїна досяг­ла істо­рич­ного мінімуму дер­жав­ного фінан­суван­ня науки – 0,16% ВВП, що спричинило зменшен­ня фінан­суван­ня цільо­вої про­гра­ми та відто­ку най­кра­щих фахівців у ІТ-індустрію та до ЦЕРНу. По­при це, на час прийнят­тя у 2019 році Програ­ми інформатизації НАН Ук­раїни на 2020-2024 роки, до складу УНГ вхо­дять 14 ресурсних центрів і 6 вірту­аль­них організацій із різних напрямів науко­вих досліджень, які належать до EGI Foundation (EGI.eu) – об’єдна­ної федерації національ­них ініціатив, а також 10 кла­с­терів, які обслу­говують інститути НАН Ук­раїни й універ­ситети.

Ство­рено основи хмарної інфрас­т­рук­тури НАН Ук­раїни, що надає ресур­си за принципом IaaS (Infrastructure as a Service – Інфрас­т­рук­тура як сервіс). Во­на дає змо­гу ефектив­но викорис­товувати обчис­лювальні ресур­си, реалізуючи модель «надан­ня ресурсів за вимогою». По­будовано пер­ший хмарний кла­с­тер Інституту тео­ретич­ної фізики ім. М.М. Бо­голюбова НАН Ук­раїни, сер­тифікований та під­ключений до EGI Federated Cloud. На жаль, цей кла­с­тер – єдиний в Ук­раїні хмарний ресурс, включений до Євро­пейсь­кої хмарної інфрас­т­рук­тури за підтрим­ки EOSC. 2018 року УНГ та EGI Foundation підпи­сали уго­ду про асоційоване членство. Співпраця з EGI.eu забез­печує мож­ливість побудови Національ­ної ініціати­ви EOSC.

– Які наступні кро­ки слід здійснити для при­швидшен­ня про­цесу вхо­д­жен­ня Ук­раїни до EOSC?

– Во­ни детально «роз­писані» у Програмі інформатизації НАН Ук­раїни на 2020-2024 роки. Зо­кре­ма, необхідно забез­печити підтрим­ку без­перебійної роботи та роз­вит­ку гібридної націо­нальної грід- та хмарної інфраструк­тури за модел­лю Євро­пейсь­кої хмарної та грід-інфрас­т­рук­тури, яка надає грід- та хмарні сервіси у сфері науки, інно­вацій та бізне­су як самостійно, так і в рам­ках EOSC.

Потрібно також роз­робити технічні умо­ви для інте­г­руван­ня національ­ної грід- та хмарної інфрас­т­рук­тури до ана­логічних міжна­род­них інфрас­т­рук­тур задля реалізації спільних про­ектів між українськи­ми та міжна­род­ними грід- і хмарними інфраструк­турами. Здійснити подальші кро­ки зі створен­ня об’єдна­ної «хма­ри» УНГ та сис­тем­ного інте­г­руван­ня в об’єдна­ну Євро­пейсь­ку хма­ру для науко­вих та інно­ваційних дослід­жень.

Спри­яти активізації міжна­род­ного науко­вого та науко­во-технічно­го співробітництва, роз­будовуючи роз­поділені хма­ри відкритої науки за тематич­ними напрямами євро­пейсь­ких і гло­бальних дослідниць­ких ін­фра­с­т­рук­тур. Ство­рювати механізми та сти­мули з відкрит­тя даних, управління ними і збе­режен­ня в надійних репозитаріях відповідно до принципів FAIR.

Не менш важ­ливо запро­вад­жувати навчальні кур­си з хмарних тех­нологій та Data Science, створені на основі хмарних сервісів, готувати спеціалістів з оброб­ки даних екс­периментів та кореневих екс­пертів даних і стюардів даних за пев­ними дис­циплінами.

– Чи необхідно щось іще, крім «організаційних зусиль»?

– Це запитан­ня з роз­ряду риторич­них. Се­ред ризиків для реалізації про­гра­ми – відсутність необхідної фінан­сової підтрим­ки та достатньої кількості ІТ-фахівців у дер­жав­них науко­вих інститутах на посадах адміністраторів е-інфрас­т­рук­тур і стюардів даних у цен­т­рах ком­петенції з кож­ної дис­ципліни.

Де­тального опрацюван­ня потре­бує і питан­ня про надан­ня відкритого досту­пу до результатів досліджень, отриманих за кош­ти дер­жав­ного бюд­жету. Нині такий доступ мож­на відкривати лише для корис­тувачів з установ, що належать до одного й того ж головно­го роз­поряд­ника бюд­жет­них коштів, і тільки за умо­ви вирішен­ня цьо­го питан­ня на відомчо­му рівні. На­при­клад, Академія не може відкрити без­кош­тов­ний доступ до викорис­тан­ня своїх обчис­лювальних ресурсів для корис­тувачів інших відомств. Си­туація може додат­ково ускладнитися у зв’яз­ку з роз­глядом у Верховній Раді Ук­раїни За­кону Ук­раїни «Про хмарні послу­ги» (відповід­ний законоп­роєкт вже прийнятий за основу), який перед­бачає, що окрім досить склад­ної про­цедури реєстрації учасників відно­син у сфері хмарних послуг, всі хмарні послу­ги мають надаватися на договірній (комер­ційній) основі. Це буде спричиняти додат­кові труднощі для науко­вих та освітянсь­ких установ, не кажучи вже про те, що таке унормуван­ня ніяк не корес­пон­дується з засад­ничою ідеєю EOSC – надан­ням вільного досту­пу до відкритих даних.

Але все це – про­бле­ми, які мож­на розв’язати, і вони, як я сподіваюсь, безумов­но будуть розв’язані. Од­нак важ­ливим є фак­тор часу. Він виз­начальний. Ук­раїна – не про­сто велика за розміром євро­пейсь­ка країна, це країна з величез­ними науко­вими досяг­нен­нями, яка навіть у над­складні кри­зові роки не роз­губила сво­го потенціалу. Можливість долучитися до Євро­пейсь­кого дослідниць­кого про­сто­ру і Євро­пейсь­кої хма­ри відкритої науки на принципах FAIR, за умо­ви фінан­сової підтрим­ки дер­жави, відкриває для всієї Ук­раїни мож­ливість досяг­ти успіхів і в еко­номіці, і в соціаль­ному роз­вит­ку.

   
Президія НАН України © Макетний зразок
  This Website is best available with Microsoft Internet Explorer 6.0+