АННОТАЦИИ К СТАТЬЯМ (ЖУРНАЛ ``ИНФОРМАТИЗАЦИЯ И СВЯЗЬ`` №1, 2026)
М.С. Паршакова
ПРИМЕНЕНИЕ СОВРЕМЕННЫХ МЕТОДОВ ГРАДИЕНТНОГО БУСТИНГА ДЛЯ РЕШЕНИЯ РЕГРЕССИОННЫХ ЗАДАЧ В МЕДИЦИНЕ: СИСТЕМАТИЧЕСКИЙ ОБЗОР (2020–2025 гг.)
Резюме: В статье анализируется применение и сравнительная эффективность методов XGBoost, CatBoost, LightGBM, HistGradientBoosting, NGBoost и классического GradientBoosting для решения задач регрессии в медицинских исследованиях, с особым акцентом на хирургические приложения, включая прогнозирование кровопотери и длительности операций. Проведен систематический обзор научных публикаций, опубликованных в период с 2020 по 2025 год в рецензируемых журналах, а также препринтов и материалов конференций. Основное внимание уделено работам, в которых либо сравнивается производительность указанных алгоритмов, либо демонстрируется их успешное применение. Систематический обзор 220 исследований показал, что в узкой области предсказания количественной кровопотери регрессионных моделей не так много; большинство исследований решают смежную задачу классификации (например, «значимая кровопотеря — да/нет»). В этих задачах LightGBM и XGBoost демонстрируют лучшие результаты (AUC до 0.933 и 0.958 соответственно). В задаче прогнозирования продолжительности операции XGBoost показал высокую точность (R2 = 84%, MAE ≈ 31 мин). CatBoost проявил себя как сильный алгоритм в задачах с большим количеством категориальных признаков, например, при прогнозировании летальности после аортокоронарного шунтирования (AUC = 0.87). HistGradientBoosting зарекомендовал себя как быстрый и эффективный метод для больших датасетов с пропущенными значениями. NGBoost, предоставляющий вероятностные прогнозы, оказался полезен в задачах выживаемости, однако его производительность в прямом сравнении часто не превосходит XGBoost или LightGBM. Во всех случаях тщательная настройка гиперпараметров и интерпретация моделей (например, с помощью SHapley Additive exPlanations – SHAP) являются критически важными для получения надежных и клинически значимых результатов. Совокупные данные указывают на то, что LightGBM и XGBoost являются ведущими кандидатами для прогнозирования исходов, связанных с кровопотерей и длительностью операций. Выбор конкретного алгоритма должен основываться на компромиссе между скоростью, точностью, типом данных и необходимостью в интерпретируемости. Проведенный обзор подчеркивает пробел в исследованиях, посвященных прямому регрессионному прогнозированию количественной кровопотери, что определяет направление для будущих работ.
Ключевые слова: градиентный бустинг, машинное обучение в медицине, хирургия, прогнозирование исходов операции, кровопотеря, продолжительность операции, XGBoost, LightGBM, CatBoost, NGBoost
M.S.Parshakova
APPLICATION OF MODERN GRADIENT BOOSTING METHODS TO REGRESSION PROBLEMS IN MEDICINE: A SYSTEMATIC REVIEW (2020–2025)
Summary: present article is analyze the application and comparative effectiveness of XGBoost, CatBoost, LightGBM,HistGradientBoosting, NGBoost, and classical GradientBoosting methods for solving regression tasks in medical research, with a particular emphasis on surgical applications, including the prediction of blood loss and operation duration. A systematic review was conducted of scientific publications from 2020 to 2025, including peer-reviewed journal articles, preprints, and conference proceedings. The focus was on studies that either compare the performance of the specified algorithms or demonstrate their successful application. The analysis revealed that direct regression models for predicting quantitative blood loss are extremely scarce; most studies address the related classification task (e.g., “significant blood loss – yes/no”). In these classification tasks, LightGBM and XGBoost consistently achieve the best performance (AUC up to 0.933 and 0.958, respectively). For the prediction of operation duration, XGBoost demonstrated high accuracy (R2 = 84%, MAE ≈ 31 minutes). CatBoost proved particularly strong in tasks involving numerous categorical features, such as predicting mortality after coronary artery bypass grafting (AUC = 0.87). HistGradientBoosting emerged as a fast and efficient method for large datasets with missing values. NGBoost, which provides probabilistic predictions, showed utility in survival analysis tasks; however, its performance rarely surpassed that of XGBoost or LightGBM in direct comparisons. Across all studies, meticulous hyperparameter tuning and model interpretability (e.g., using SHAP) were critical for achieving reliable and clinically meaningful results.Although no single study offers a comprehensive comparison of all six methods within a single, narrow surgical regression task, the cumulative evidence indicates that LightGBM and XGBoost are the leading candidates for predicting outcomes related to blood loss and operation duration. The choice of a specific algorithm should be guided by trade-offs among speed, accuracy, data type, and interpretability requirements. This review highlights a significant research gap concerning direct regression modeling of quantitative blood loss, thereby defining a clear direction for future work.
Keywords: gradient boosting, machine learning in medicine, surgery, surgical outcome prediction, blood loss, operation duration, XGBoost, LightGBM, CatBoost, NGBoost.
DOI: 10.34219/2078-8320-2026-16-1-102-108
ИНФОРМАЦИЯ ОБ АВТОРАХ
Паршакова Мария Сергеевна — аспирант 3 года обучения Санкт-Петербургского Федерального исследовательского центра Российской академии наук: e-mail: mary.parshakova@mail.ru
Parshakova Maria Sergeevna — 3-year postgraduate student of the St. Petersburg Federal Research Center of the Russian Academy of Sciences: e-mail: mary.parshakova@mail.ru