Биг Дата на службе у медиков
Автор
Григорий Рудницкий
В медицине большие данные особенно востребованы. Они помогают осуществлять качественную диагностику и распознавание заболеваний
Медицина принадлежит к числу тех отраслей, в которых большие данные (Big Data) особенно востребованы. Судите сами, объемы архивов медицинских изображений ежегодно растут на 20–40%, размер трехмерной компьютерной томограммы составляет 1 Гбайт, трехмерного МРТ-изображения — 150 Мбайт, рентгеновского снимка — 30 Мбайт, геном человека «весит» 800 Мбайт, а 200 геномов раковых клеток «тянут» аж на 300 Тбайт.
При этом качественная диагностика, своевременное распознавание заболеваний и правильный подбор терапии - одни из наиболее серьезных и трудноразрешимых задач для современных врачей. Здесь Big Data могут оказать неоценимую помощь медикам. О том, как это происходит в Европе, нам рассказал Тим Конрад, биоинформатик Свободного университета Берлина, стипендиат Gerda and Klaus Tschira Foundation.
Насколько широко анализ больших данных применяется в европейской медицине?
Очень широко. Существует два глобальных уровня медицины: исследовательский и прикладной. Моя работа в университете связана с обоими направлениями: я веду исследования и, в то же время, занимаюсь адаптацией и передачей технологий, разработанных в университете, для использования в лечебных учреждениях. Можно сказать, что я «говорю на двух языках», но, конечно, моя основная сфера — научная.
С точки зрения науки, с Big Data связано немало интересного. Например, один из наших проектов в сферах медицины и биологии основан на использовании больших объемов медицинских данных. В чем суть? В человеческом организме выявляется пораженный ген, а мы находим причинно-следственные связи возникновения различных заболеваний, спровоцированных этим геном. Эти исследования применимы и для практической медицины: врачам-клиницистам важно, чтобы в результате наших изысканий можно было бы подобрать больному необходимое лекарство и терапию. Моя работа объединяет в себе обе эти задачи.
В каких областях медицины результаты исследований на основе анализа больших данных чаще всего и больше всего находят успешное практическое применение?
Некоторое время назад была очень популярна тема, связанная с генетикой — именно в ней исследования, подобные нашим, востребованы. Сейчас наша главная задача состоит в том, чтобы соединить несколько сфер деятельности — науку о генах, исследование белковой структуры клетки, обменные процессы, происходящие в человеческом организме. Поняв, как они взаимодействуют, можно выявить причинно-следственные связи возникновения той или иной болезни и выяснить, решается ли проблема исправлением конкретного гена. Можно будет, например, определить специфику строения клеток у каждого пациента, на основе этого понять, как устроен организм, а затем назначить соответствующий курс лечения, оптимальный исключительно для данного человека. Вот здесь и требуются Big Data, поскольку речь идет не только о генах, но и о белках и других органических веществах — это огромный объем данных, которые необходимо собрать и проанализировать.
Насколько хорошо умеют сами медики работать с большими данными? Как им помочь в этом, как их стимулировать?
Важно объяснить врачам реальные выгоды использования технологий — как Big Data могут помочь в их работе. Наш подход таков: мы рассказываем врачам о возможностях той или иной технологии, а затем показываем, как их можно применить на практике.
Очень важный аргумент, который всегда стараемся использовать в разговоре с врачами, — стратификация. Например, при лечении рака молочной железы предписывается определенный набор медикаментов — три различных вида лекарств. С помощью Big Data мы помогаем выбрать оптимальный вариант лечения. Мы не гарантируем, но подсказываем, на основании имеющихся статистических данных, основанных на реальных историях болезней, что вот именно это лекарство и именно эта терапия будет иметь наиболее благоприятные последствия для того или иного пациента. Это способствует успешному лечению, а врачу дает возможность не идти методом проб и ошибок. Раньше стратегия врачей состояла в том, чтобы назначить лекарство, посмотреть динамику состояния пациента и, если нужного результата нет, назначить другой препарат. Лишь совсем недавно, около пяти лет назад, врачи начали использовать передовые технологии.
Столь обширным научным сведениям требуется серьезная защита. Какие механизмы защиты больших данных вы считаете наиболее подходящими для медицинских учреждений, которые с ними работают?
Сейчас научные учреждения работают, как правило, с обезличенными и зашифрованными данными. Даже если кто-то получит к ним доступ, прочесть их не сможет. Итальянский ученый Сильвио Микали получил награду за разработку концепции Zero-knowledge Proof. Это очень актуальная тема, которая позволяет успешно работать с зашифрованными массивами данных.
Конечно, нельзя забывать и о безопасности хранилища данных. Один из способов обеспечить эту безопасность — централизованно хранить информацию в центре обмена данными (ЦОДе), к которому организован надежный доступ по защищенным каналам связи. Это гораздо надежнее, чем хранить информацию на локальных компьютерах, а современные технологии высокопроизводительных вычислений позволяют работать с огромными объемами данных в реальном есть не нужно распределять данные по различным ЦОДам, а содержать их централизованно и там же обрабатывать. Все сведения должны физически находиться в одном месте и в одной базе. Тем более нельзя переносить их на какой-то частный компьютер. Здесь могут быть очень полезны вычислительные платформы in-memory, как реализовано в SAP HANA.
Бюджет больниц и поликлиник, как правило, не очень велик. Как учесть этот фактор, если медицинским учреждениям необходимо работать с большими данными?
Современные технологии обработки данных позволяют успешно вести работу с большими данными, даже если в распоряжении больницы или поликлиники нет дорогих и мощных компьютеров. Основной принцип современных технологий — в том, что они не зависимы от «железа», от аппаратного обеспечения. Не так давно мы в качестве теста использовали для работы с Big Data несколько игровых приставок PlayStation. Тест проводился в США, но мы можем повторить эту демонстрацию и в России. Исследование показало, что даже недорогие устройства, чья стоимость составляет несколько сот евро, позволяют анализировать и исследовать большие данные, причем весьма успешно. Такие компьютеры можно объединять в вычислительные массивы, и тогда, например, над одной задачей могут работать несколько лечебных и исследовательских учреждений.
Расскажите, пожалуйста, о наиболее интересном и показательном примере, связанном с использованием больших данных в медицине.
Три-четыре года назад мы занимались анализами в области протеомики в клинике Лейпцига. Исследовались все белки, которые содержатся в крови человека, и сравнивались анализы крови здорового пациента и больного, страдающего той или иной формой рака. Определялись различия в составе крови, которые можно использовать для диагностики. И здесь нам очень помогли большие данные, без них это было бы просто неосуществимо. Ведь работа велась со многими тысячами образцов белков. В результате удалось создать статистическую модель, пригодную для диагностики. Сегодня с ее помощью диагностируют новых доноров. Когда донор сдает кровь впервые, ее состав анализируется на основе такой методики. И у нескольких людей, которые хотели сдать свою кровь, обнаружился раковый паттерн. Выявив его, мы смогли предложить им превентивное лечение на ранней стадии развития заболевания.
Очень важно, что такие исследования сегодня могут стать общедоступными. Например, одна из японских клиник смогла с помощью технологий SAP HANA в 400000 раз ускорить выполнение анализа генома человека: раньше на него требовалось несколько дней, теперь же результат можно получить уже через 20 минут. Кроме того, удалось существенно снизить стоимость такого исследования — теперь оно доступно многим и может использоваться не только в процессе лечения, но и как профилактическая мера.
Как и любая технология, Big Data проходят путь от элитарных к общедоступным, а это значит, что у многих людей в разных странах мира, в том числе и в России, появляется возможность точной диагностики и эффективного лечения, а у врачей — больше возможностей для того, чтобы сохранять и возвращать здоровье.
Источник: IT Manager №12, 2013
Опубликовано 25.12.2013
Похожие статьи