|
Рубрика:
Наука и технологии /
Раздел для научных публикаций
|
Facebook
Мой мир
Вконтакте
Одноклассники
Google+
|
Осипов А.А., ФГАОУ ВО «Московский государственный технический университет имени Н.Э. Баумана (национальный исследовательский университет)», Москва, patrol8@yandex.ru
Ильичев В.Ю., к.т.н., ФГАОУ ВО «Московский государственный технический университет имени Н.Э. Баумана (национальный исследовательский университет)», Москва, patrol8@yandex.ru
Исследование методов повышения качества модели классификации на примере распознавания погодных явлений
Рассмотрены методы последовательного повышения качества бинарной классификации погодных явлений на основе алгоритма градиентного бустинга LightGBM. Представлена базовая модель с 26 признаками, содержащая скрытую утечку данных, завышающую метрику F1 до 90,1%. Показано, что устранение утечки снижает F1 до реальных 79,7%, расширение пула статическими физическими признаками не даёт значимого прироста, тогда как введение лаговых и трендовых признаков обеспечивает рост ROC AUC с 92,7 до 99,2%. Сделаны выводы, что наибольший эффект дают временные признаки и корректность методологической оценки, а данный подход можно применять для повышения надёжности классификационных моделей в прикладных задачах.
Введение
Автоматическая классификация погодных явлений по данным наземных метеостанций представляет собой одну из ключевых задач современной прикладной метеорологии и интеллектуального анализа данных. Востребованность подобных систем обусловлена их критической ролью в инфраструктуре безопасности и экономики. В системах предупреждения об опасных явлениях своевременное распознавание штормов, ливней или гололёда позволяет спасательным службам заблаговременно мобилизовать ресурсы и минимизировать человеческие жертвы. В управлении энергосетями точная классификация погодных условий необходима для прогнозирования пиковых нагрузок: например, экстремально низкие температуры или обледенение проводов напрямую влияют на стабильность подачи электроэнергии. Транспортная логистика также зависит от достоверности метеоданных: авиадиспетчеры, морские порты и наземные перевозчики используют информацию о видимости, ветре и осадках для корректировки маршрутов и графиков движения, что напрямую влияет на экономическую эффективность и безопасность перевозок [1, 2].
Таким образом, цель работы состоит не просто в сборе данных, а в определении текущего состояния атмосферы по совокупности измеряемых параметров с высокой степенью достоверности.
<...>
Ключевые слова: классификация погодных явлений, градиентный бустинг, инженерия признаков, утечка данных
Полную версию статьи читайте в журнале Подпишитесь на журнал
Facebook
Мой мир
Вконтакте
Одноклассники
Google+
|