Abstract
<jats:p>В работе проведён сравнительный анализ алгоритмов машинного обучения для классификации режимов работы теплогидравлического стенда по данным датчиков расхода, температуры и давления. Рассмотрены и сопоставлены ансамблевые методы Random Forest, Gradient Boosting и CatBoost, нейронные сети, алгоритм k-ближайших соседей (k-NN), логистическая регрессия и метод опорных векторов (SVM). Подготовка данных включала удаление пропусков и ошибочных значений, стандартизацию признаков, корреляционный и дисперсионный анализ, группировку взаимосвязанных параметров, снижение размерности методом главных компонент (PCA), а также применение регуляризации для уменьшения мультиколлинеарности и предотвращения переобучения моделей. Качество оценивалось по кросс-валидации и метрике F1. Результаты показали, что ансамблевые методы достигают наивысшей точности (значение метрики F1 ≈ 0.99–1.0) и являются наиболее надёжными для задачи классификации. Нейросетевые методы и k-NN также продемонстрировали высокую эффективность (F1 ≈ 0.89–0.99), в то время как линейные модели показали средние результаты, но выиграли от применения PCA и регуляризации. Полученные результаты подтверждают применимость методов машинного обучения для интеллектуальной автоматизации мониторинга и диагностики технологических систем в реальном времени.</jats:p>