к списку новостей

Новости

15 сентября 2020 года, 16:09

Биоинформатики ИТМО разработали метод диагностики воспалений кишечника

Студент Университета ИТМО Артем Иванов и его научный руководитель, возглавляющий Международную лабораторию «Компьютерные технологии», Владимир Ульянцев в рамках международных соревнований Metagenomics Diagnosis for IBD Challenge(MEDIC) разработали метод диагностики воспалительных заболеваний кишечника. Проект ученых стал лучшим среди 25 команд со всего мира.

Среди воспалительных заболеваний кишечника – тяжелых хронических болезней, приносящих пациентам периодическую боль, диарею, потерю веса и даже лихорадку, наиболее распространенными являются язвенный колит и болезнь Крона. Перед участниками MEDIC была поставлена задача создать алгоритм, который на основании данных о микробиоте – микроорганизмов, населяющих пищеварительный тракт, определял бы с высокой точностью, есть ли у пациента проблемы с кишечником. 

«Прошлой осенью Владимир Ульянцев показал мне письмо с предложением участвовать в соревновании, — вспоминает Артем Иванов. ― Мне показалось, что это интересно — соревнования, направленные на поиск более точной диагностики заболеваний. В нашей лаборатории мы уже около семи лет разрабатываем программы для метагеномного анализа микробиоты, поэтому решили заявиться».

На турнире нужно было решить две задачи, по каждой из которых велся отдельный зачет. Сначала участники получали размеченные данные микробиотного исследования 150 пациентов. На них нужно было обучить компьютерный алгоритм правильно определять состояние человека — здоров ли он, болен язвенным колитом или страдает от болезни Крона. После этого обученный анализатор должен был проверить набор таких же данных, только без отметок, и сам сделать вывод, к какой из трех категорий относится каждый пациент.

Второе задание было сложнее. Давались лишь сырые данные прочтений метагенома — короткие последовательности ДНК микробиоты пациентов, про которые ничего не известно. Ученым самим предстояло выделить ключевые для постановки диагноза признаки и на их основе сделать предсказание на неразмеченных данных. Для решения этой задачи биоинформатики ИТМО использовали собственную программу Metafast. Она помогла выделить из всей информации о ДНК некоторые связанные структуры, которые могли являться ключевыми, и на их основе запускали методы машинного обучения, обучали классификатор. 

Всего, чтобы получить наиболее точный метод диагностики, было предпринято около трех десятков попыток. Как отмечает Владимир Ульянцев, нащупать правильный путь и одержать победу сразу в двух подсоревнованиях турнира им помог поиск дополнительной информации. Команде ИТМО удалось найти в интернете еще одну подборку размеченных данных, чтобы также использовать ее для обучения и проверки своего анализатора.

«Задача диагностирования этих заболеваний очень острая, — подчеркивает Артем Иванов. — Пока в ходе участия в MEDIC мы выделили метагеномные признаки, по которым можно диагностировать заболевание. Теперь интересно понять, как и почему они связаны с развитием болезни. Как с любым медицинским исследованием: машинное обучение — это хорошо, но если мы дальше идем к какому-то врачу, нужно объяснить, а что у нашего черного ящика внутри ― он не может слепо верить какой-то модели».

Поиск по дате: