Анализ генетической информации поможет избежать осложнений после инфаркта
Исследователи из НИУ ВШЭ разработали модель машинного обучения, которая предсказывает риск развития осложнений у пациентов, перенесших инфаркт миокарда. В модели впервые учли генетические данные, что позволило точнее оценить риск долгосрочных осложнений. Исследование опубликовано в журнале Frontiers in Medicine.
Ишемическая болезнь сердца (ИБС) — состояние, при котором сердце не получает достаточно крови и кислорода из-за сужения или блокировки коронарных артерий. Обычно его провоцируют бляшки, образующиеся на стенках сосудов из жиров и холестерина. ИБС может проявляться как стенокардия (боль в груди), инфаркт миокарда (сердечный приступ) или в виде других осложнений.
Ученые проанализировали данные пациентов Сургутского окружного центра диагностики и сердечно-сосудистой хирургии, поступивших с инфарктом миокарда в период с 2015 по 2024 год. При поступлении в отделение неотложной помощи врачи-исследователи разъясняли пациентам положения исследования и получали их согласие на участие. Затем кардиологи оценивали состояние коронарных артерий, снабжающих сердце, и, исходя из оценки, проводили операции по восстановлению кровотока: баллонную ангиопластику и стентирование или аортокоронарное шунтирование. Пациентов лечили медикаментозно с помощью блокаторов РААС, бета-блокаторов, статинов и двойной антиагрегантной терапии. Данные фиксировались во внутрибольничных историях болезни. У каждого пациента врачи определяли стандартные клинические показатели: артериальное давление, индекс массы тела, уровень холестерина и глюкозы.
На лабораторном этапе врачи-исследователи выделяли ДНК из лейкоцитарных колец в собранных образцах крови, а затем замораживали при температуре –80 °C для будущего генетического тестирования. Генотип определяли по конкретной генетической вариации (полиморфизму) в гене VEGFR-2. Генетический маркер VEGFR-2 — элемент в системе сигналов организма, контролирующий рост новых кровеносных сосудов. Существуют три варианта генотипа — C/C, C/T и T/T, — отличающихся вариацией нуклеотидов ДНК цитозина (C) или тимина (T) в этом участке гена. Маркер давно известен, однако его влияние на прогноз осложнений после инфаркта миокарда исследовали впервые.
Авторы статьи рассмотрели влияние 39 факторов на прогноз рисков сердечной смерти, повторного острого коронарного синдрома, инсульта и необходимости повторной реваскуляризации — процедуры, помогающей восстановить кровоток в артериях. Чтобы выбрать эффективную модель, исследователи обучили и протестировали несколько алгоритмов машинного обучения: градиентный бустинг (CatBoost и LightGBM), случайный лес, логистическую регрессию и подход AutoML.
Наилучшую производительность показала модель CatBoost — алгоритм градиентного бустинга, оптимизированный для работы с данными, обозначающими категории или группы, а не числовые значения. Он строит прогнозы за счет последовательного создания и обучения «слабых» деревьев решений, где следующее дерево корректирует ошибки предыдущих. При построении деревьев алгоритм разделяет данные на две части: модель обучается на одной части данных, а ошибки рассчитываются на другой. Это снижает эффект переобучения, при котором модель просто запоминает правильные ответы и помогает найти общие закономерности для прогнозов в незнакомых случаях.
Влияние признаков на точность модели оценивали с помощью метода последовательного добавления признаков, который проверяет их вклад на каждом этапе. Ученые отобрали 9 наиболее значимых факторов: пол, индекс массы тела, индекс коморбидности Чарлсона, учитывающий наличие серьезных сопутствующих болезней, состояние боковой стенки левого желудочка, степень поражения ствола левой коронарной артерии, количество пораженных артерий, вариант гена VEGFR-2, выбор процедуры чрескожного коронарного вмешательства или аортокоронарного шунтирования, а также дозировка статинов.
Результаты показали, что доза статинов — лекарств, которые используются для снижения уровня холестерина в крови, — наиболее важный фактор, влияющий на риск развития осложнений. Высокие дозы статинов снижают этот риск, особенно у пациентов с неблагоприятным генотипом. Полиморфизм VEGFR-2, в частности наличие аллеля T, оказался на четвертом месте по важности.
Мария Попцова
«Ранее генетические факторы не использовались в моделях машинного обучения, в основном из-за того, что секвенирование или даже генотипирование отдельных нуклеотидов не проводится в больницах. Нам же, помимо стандартных показателей, были доступны данные о полиморфизме в гене VEGFR-2. Благодаря этому удалось сравнить этот показатель с другими и выяснить, что аллель риска варианта VEGFR-2 входит в пятерку наиболее важных факторов для прогнозирования долгосрочных результатов у пациентов с инфарктом миокарда», — объясняет один из авторов статьи, заведующая Международной лабораторией биоинформатики НИУ ВШЭ Мария Попцова.
Исследователи подчеркивают, что анализ генетических данных помогает в создании более точных и персонализированных моделей прогноза рисков сердечно-сосудистых осложнений у пациентов после инфаркта миокарда.
Александр Кирдеев
«Сердечно-сосудистые болезни требуют ресурсов для диагностики, лечения, реабилитации и профилактики и потому создают высокую нагрузку на систему здравоохранения. Внедрение подобных моделей в клиническую практику позволит снизить смертность и частоту повторных инфарктов, оптимизировать лечение и уменьшить нагрузку на врачей», — комментирует один из авторов статьи, стажер-исследователь Международной лаборатории биоинформатики Александр Кирдеев.
Исследование выполнено в рамках проекта НИУ ВШЭ «Зеркальные лаборатории».
Вам также может быть интересно:
Fall into ML 2024: взгляд в будущее машинного обучения
25–26 октября в Москве состоялась конференция Fall into ML, организованная Институтом искусственного интеллекта и цифровых наук ФКН НИУ ВШЭ совместно с Центром ИИ при поддержке титульного партнера — Сбера. На протяжении двух дней ведущие специалисты в области искусственного интеллекта обсуждали перспективы развития фундаментальных технологий ИИ.
«Наша система позволяет предотвращать сбои в работе центров обработки данных»
Студент первого курса магистерской программы «Продуктовый подход и аналитика данных в HR-менеджменте» Константин Балцат с командой единомышленников разработали систему прогнозирования отказов жестких дисков на основе машинного обучения. С этим проектом они второй год подряд входят в число лучших на хакатоне «Цифровой прорыв». «Вышка.Главное» побеседовала с Константином о разработках инноваций и учебе в университете.
НИУ ВШЭ и ПСБ провели хакатон по ИИ для студентов ведущих вузов страны
В конце сентября онлайн-кампус НИУ ВШЭ и ПСБ организовали хакатон для студентов, которые увлекаются анализом данных, визуализацией и машинным обучением, а также студентов креативных индустрий. На хакатон зарегистрировалось 620 человек, приняло участие 428 человек из разных регионов РФ. За первое место боролись студенты лучших российских университетов, а также учащиеся из других государств. Победителями турнира стала команда из Вышки.
«В третий раз соберем на площадке ВШЭ лучших ученых и исследователей ИИ в России»
Институт искусственного интеллекта и цифровых наук ФКН НИУ ВШЭ и Центр ИИ 25–26 октября в Москве организуют конференцию Fall into ML 2024. Главной темой ежегодного мероприятия станут перспективы развития фундаментального искусственного интеллекта. Титульным партнером конференции выступит Сбер.
От секвенирования к разработке кардиопанели: как прошла летняя школа по кардиогенетике
С 19 по 29 августа Центр непрерывного образования факультета компьютерных наук НИУ ВШЭ совместно с Институтом аналитического приборостроения РАН, Институтом спектроскопии РАН и компанией «Синтол» провел летнюю школу «Кардиогенетика: от секвенирования к разработке кардиопанели». Школа проводилась в рамках Федеральной научно-технической программы развития генетических технологий на 2019–2027 годы (проект 15.ИП.21.0004).
Школа по ML в биоинформатике: «отличная возможность для нетворкинга и изучения нового материала»
Факультет компьютерных наук НИУ ВШЭ провел ежегодную летнюю школу по машинному обучению в биоинформатике, слушателями которой стали более 300 человек из разных университетов, институтов и организаций. Всего на событие зарегистрировались более 800 человек. Трехдневная программа включала в себя лекции и семинары.
Genotek стал партнером магистерской программы ВШЭ «Анализ данных в биологии и медицине»
В сентябре 2024 года сотрудники медико-генетического центра Genotek выступят преподавателями и руководителями курсовых работ и магистерских диссертаций на программе «Анализ данных в биологии и медицине» факультета компьютерных наук НИУ ВШЭ. Экспертиза компании в анализе BigData и биоинформатической обработке данных секвенирования позволила переработать учебный план программы с учетом современных методов анализа данных в биологии и медицине.
Ученые НИУ ВШЭ показали эффективность машинного обучения при прогнозировании инфляции
Инфляция — один из ключевых показателей экономической стабильности, и точное прогнозирование ее уровня в различных регионах имеет большое значение для государства, бизнеса и домохозяйств. Татьяна Букина и Дмитрий Кашин из НИУ ВШЭ в Перми выяснили, что машинное обучение для прогнозирования инфляции превосходит классические эконометрические модели в долгосрочных прогнозах. Исследование проводилось на примере субъектов Приволжья. Результаты опубликованы в журнале HSE Economic Journal.
Ученые НИУ ВШЭ предложили модель, лучше других определяющую тематику текстов
Тематические модели — алгоритмы машинного обучения, способные сортировать большие объемы текстов по темам. Исследователи из НИУ ВШЭ в Санкт-Петербурге сравнили пять тематических моделей и определили, какие из них работают лучше. Наименьшее число ошибок показали две модели, одна из которых, GLDAW, — разработка Лаборатории социальной и когнитивной информатики НИУ ВШЭ в Санкт-Петербурге. Статья опубликована в журнале PeerJ Computer Science.
«Цель школы Spring into ML — объединить молодых ученых, занимающихся математикой ИИ»
Институт искусственного интеллекта и цифровых наук ФКН НИУ ВШЭ и Университет Иннополис провели для студентов, аспирантов и молодых ученых недельную школу, посвященную применению математики в машинном обучении и искусственном интеллекте. 50 участников Spring into ML прослушали 24 доклада о машинном обучении, участвовали в тематических питч-сессиях и прошли два мини-курса по диффузионным моделям — развивающейся области ИИ для генерации данных.