ОРИГИНАЛЬНЫЕ ИССЛЕДОВАНИЯ
Актуальность: Благодаря Национальной стратегии развития искусственного интеллекта в Российской Федерации активно разрабатываются и внедряются новые технологии на основе искусственного интеллекта, что приводит к появлению большого количества различных практических и научных задач, которые в свою очередь требуют удобных инструментов для их решения. Одним из них является инструмент, предназначенный для ROC-анализа, который был разработан и успешно применялся в рамках проекта «Эксперимент по использованию инновационных технологий в области компьютерного зрения для анализа медицинских изображений и дальнейшего применения в системе здравоохранения города Москвы». Однако для решения более широкого спектра задач, связанных с аналитикой работы технологий на основе искусственного интеллекта, возникла острая необходимость в разработке модуля сравнения ROC-кривых.
Цель: реализовать модуль инструмента ROC-анализа по сравнению площади под характеристической кривой с помощью статистических критериев и расчётом p-значения и апробировать его на реальных данных.
Материалы и методы: инструмент реализован на языке Python 3.9. 95% доверительный интервал для ROC-кривых рассчитывался с помощью метода случайных выборок с возвратом (бутстреппинг) и метода ДеЛонг (DeLong). Сравнение площадей под ROC-кривыми осуществлялось с помощью перестановочного теста.
Апробация инструмента осуществлялась на результатах работы 6 алгоритмов на основе технологий искусственного интеллекта на 2 наборах данных. Проводилось попарное сравнение площади под ROC-кривой и полученные результаты сравнивали с результатами анализа тех же данных методом ДеЛонг функции roc.test языка R 3.6.1.
Результаты: р-значения, полученные с помощью перестановочного теста, оказались в большинстве случаев сопоставимы с результатами roc.test, однако в 4 из 30 случаев р-значения принципиально отличались, что приводило к изменениям интерпретации теста.
Обсуждение: различия в результатах, рассчитанных двумя способами, вероятно, обусловлены особенностями используемых методов: ДеЛонг является более консервативным. Также из-за использования метода псевдорандомизации в перестановочном тесте возможна вариативность результатов, что может привести к неопределенности. Кроме того, разработанный инструмент сравнивает наборы данных с одинаковым количеством элементов, что является ограничением его использования, однако возможна дальнейшая его разработка с целью преодоления данного ограничения.
Заключение: был успешно реализован и апробирован модуль сравнения ROC-кривых с помощью статистических критериев с расчётом p-значения.
Цель: разработать модель прогнозирования числа впервые выявленных пациентов с ВИЧ-инфекцией в субъектах Российской Федерации с использованием методов машинного обучения.
Материалы и методы: исходные данные были получены из формы федерального статистического наблюдения №61 и данных Росстата о среднегодовой численности населения - из 85 субъектов РФ (2016-2022 годы). Проведено сравнение методов машинного обучения и их ансамблей при построении регрессионной модели для прогнозирования числа впервые выявленных пациентов с ВИЧ-инфекцией в субъектах РФ.
Результаты: модель строилась с помощью методов: линейной регрессии, решающего дерева, случайного леса, градиентного бустинга на решающих деревьях и бэггинга. Использовалась интерактивная вычислительная среда «Jupiter Notebook» (6.5.2) и программные библиотеки «Pandas» (1.5.3), «Scikit-learn» (1.0.2), «Statsmodels» (0.13.5) и CatBoost. Оптимальные гиперпараметры подбирались с использованием фреймворка «Optuna». В качестве метрик качества выступили: корень из среднеквадратичной ошибки (RMSE); коэффициент детерминации (R2); средняя абсолютная ошибка (MAE); средняя абсолютная процентная ошибка (MAPE); медианная абсолютная ошибка (MedAE).
Выводы: применение методов и алгоритмов машинного обучения дает разные результаты в части метрик точности работы моделей. Наихудшие значения всех метрик качества продемонстрировал метод линейной регрессии (MAPE 67%). Наилучшим являлось сочетание (Бэггинг) двух ансамблевых методов — случайного леса и градиентного бустинга на решающих деревьях, поскольку было достигнуто максимальное значение большего числа метрик качества. В этой связи целесообразно проверять все доступные методы и алгоритмы машинного обучения и затем выбирать из полученных результатов наиболее качественную модель.
Актуальность. Ранняя диагностика аксиального спондилоартрита (аксСпА) является актуальной задачей, требующей поддержки принятия клинических решений (ППКР). В настоящее время значительная часть данных, применимых для разработки систем ППКР, представлена в неструктурированном виде. Семантический анализ медицинских текстов – сложная задача, требующая создания универсальных инструментов для извлечения именованных сущностей. Крупнейшим источником данных для аннотирования биомедицинских текстов является Unified Medical Language System (UMLS) – международный метатезаурус, включающий свыше 11 млн вариантов написания 4,6 млн терминов (концептов). Ключевой проблемой при использовании UMLS для анализа медицинских текстов является наличие большого количества неспецифичных (общих) терминов, не имеющих явного клинического смысла. Применение таких концептов приводит к значительному ухудшению результатов поиска, что указывает на необходимость создания инструментов автоматической оценки степени специфичности терминов UMLS.
Цель исследования. Разработка алгоритма для оценки степени специфичности терминов метатезауруса UMLS (на примере аксиального спондилоартрита).
Методы и материалы. В качестве источника информации для автоматического поиска клинических терминов использовались аннотации к англоязычным научным статьям. Тексты аннотаций извлекались с применением средств поисковой системы PubMed и помещались в единый электронный корпус, использованный для последующего извлечения концептов метатезауруса UMLS. Каждый из 24276 текстов корпуса имел однозначную метку принадлежности к одному из заболеваний дифференциального ряда для аксСпА. В общий свод включено 8260 концептов, каждый из которых получил экспертную бинарную метку относительной специфичности.
Результаты. Сформирован набор правил, основанных на сравнении средних длин иерархических цепей атомарных формулировок терминов, общего числа прямых связей, TF-IDF меры и числа связей «родитель-потомок» концептов UMLS. Данные правила включены в итоговый алгоритм оценки специфичности концептов, точность которого при попарном сравнении составила 99,1% для тестовой выборки. Однако точность модели при бинарной классификации всех концептов из выделенного свода терминов составила 74,2%, что является недостаточным для обоснования его применения при автоматическом сокращении терминологических сводов большого объема. Сформированы критерии и ограничения для использования разработанного алгоритма в процессе аннотации клинических документов.
Цель. Сравнительная оценка качества прогностических моделей внутригоспитальной летальности (ВГЛ) у больных инфарктом миокарда с подъемом сегмента ST (ИМnST) после чрескожного коронарного вмешательства (ЧКВ), разработанных на основе предикторов в непрерывной, дихотомической и многоуровневой категориальной формах.
Материалы и методы. Проведено одноцентровое ретроспективное исследование, в рамках которого анализировали данные 4677 историй болезни пациентов с ИМnST после ЧКВ, находившихся на лечении в Региональном сосудистом центре г. Владивостока. Было выделено 2 группы больных: первая - 318 (6,8%) человек, умерших в стационаре, вторая — 4359 (93,2%) — с благоприятным исходом лечения. Прогностические модели ВГЛ с непрерывными переменными были разработаны методами многофакторной логистической регрессии, случайного леса и стохастического градиентного бустинга. Дихотомизация предикторов выполнялась методами поиска на сетке оптимальных точек отсечения, расчета центроидов и аддитивного объяснения Шепли (SHAP). Для многоуровневой категоризации предложено использовать объединение пороговых значений, выделенных при дихотомизации, а также ранжирование порогов отсечения с помощью весовых коэффициентов многофакторной логистической регрессии.
Результаты. По результатам многоступенчатого анализа показателей клинико-функционального статуса больных ИМnST были выделены и валидированы новые предикторы ВГЛ, выполнена их категоризация и разработаны прогностические модели с непрерывными, дихотомическими и многоуровневыми категориальными переменными (AUС: 0.885-0.902). Модели, предикторы которых были выделены методом мультиметрической категоризации, не уступали по точности моделям с непрерывными переменными и имели более высокие метрики качества, чем алгоритмы с дихотомическими предикторами. Преимущество моделей с многоуровневой категоризацией предикторов заключалось в возможности объяснения и клинической интерпретации результатов прогнозирования ВГЛ.
Заключение. Многоуровневая категоризация предикторов является перспективным инструментом для объяснения прогнозных оценок в клинической медицине.
ПРАКТИЧЕСКИЙ ОПЫТ
В статье рассмотрены методы и процедуры разработки нейросетевой системы поддержки принятия решения при выборе тактики оперативного вмешательства на коронарных сосудах сердца, предназначенной для консультирования широкого круга практикующих кардиологов и кардиохирургов при принятии решения о тактике проведения оперативного вмешательства при состояниях пациентов, связанных с нарушением проводимости коронарных сосудов. Основываясь на математической модели, учитывающей ряд факторов и опыт исходов предыдущих операций, нейросетевая система предлагает выбор между аортокоронарным шунтированием и чрескожным коронарным вмешательством. Определённое системой решение может служить дополнительным голосом и фактором для окончательного принятия коллегиального решения в сложных клинических случаях. Правильно принятое решение влияет на сроки восстановления пациента после операции, качество жизни после восстановления, возможность продолжать трудовую деятельность после лечения. Нейросетевая система поддержки принятия решения в области кардиохирургии выполнена в виде стандартного приложения для персонального компьютера со специфическими техническими характеристиками, позволяющими обрабатывать большой массив данных. Доступ к системе может получить любой врач кардиолог или кардиохирург, зарегистрированный в системе и прошедший валидацию. Созданный комплекс призван обеспечить учреждения системы здравоохранения цифровым продуктом и сервисом отечественного производства на основе нового технологического уклада.
В статье рассматривается опыт применения инструментов визуализации данных при подготовке схем территориального планирования региональных систем здравоохранения для принятия управленческих решений по увеличению доступности медицинской помощи. Описан опыт формирования картографических данных для анализа текущего состояния и целевого уровня различных систем оказания медицинской помощи региона по профилям. Приведены тенденции развития средств визуализации, а также определена необходимость наличия специфических компетенций по работе с визуальными картографическими данными у лиц, принимающих решения (далее – ЛПР). Визуализация схем территориального планирования систем здравоохранения регионов позволяет системно оценить организацию оказания медицинской помощи на основе картографического анализа и информации о взаимном расположении медицинских организаций, оперативно получить объективные данные о доступности медицинской помощи населению и ускорить процесс принятия управленческих решений, направленных на устранение выявленных проблем. Всё это требует наличия у ЛПР сформированных компетенций визуальной коммуникации и визуальной грамотности.
Одной из ведущих задач здравоохранения является сохранение здоровья детского населения, что достигается путем проведения комплексной оценки состояния здоровья. Необходимо своевременно выявлять отклонения в состоянии здоровья детей при проведении периодических медицинских осмотров, что обосновывает разработку более точных методов, возможность извлечения полезной информации по данным, полученным в ходе комплексного осмотра детей.
Цель работы: усовершенствовать процедуру проведения профилактических осмотров детей школьного возраста за счёт использования цифровых технологий и дистанционной передачи данных.
Материалы и методы: с использованием цифровых технологий проведён профилактический осмотр 128 детей в возрасте 14-17 лет г. Самары, в группу сравнения вошли 54 подростка, которым профилактический осмотр проводился с использованием традиционных методов; группы сопоставимы по полу и среднему возрасту.
Результаты: в результате работы было показано, что использование цифровых технологий позволяет сократить работу медицинского персонала при проведении медицинского осмотра школьников, а также с использованием аналитического программно-аппаратного комплекса было выявлено 47,8% детей, имеющих нарушения физического развития, 3,8% детей со впервые выявленным нарушением бронхиальной проводимости и 4,6% детей с артериальной гипертензией.
Выводы: использование цифровых технологий позволяет снизить количество возможных ошибок при фиксации антропометрических и физиометрических показателей и повысить оперативность принятия врачебных решений при проведении профилактических осмотров детей.
ISSN 2413-5208 (Online)