|
Рубрика:
Наука и технологии /
Раздел для научных публикаций
|
Facebook
Мой мир
Вконтакте
Одноклассники
Google+
|
Косова К.А., ФГАОУ ВО «Московский государственный технический университет имени Н.Э. Баумана (национальный исследовательский университет)», Москва, patrol8@yandex.ru
Ильичев В.Ю., к.т.н, ФГАОУ ВО «Московский государственный технический университет имени Н.Э. Баумана (национальный исследовательский университет)», Москва, patrol8@yandex.ru
Исследование типа модели машинного обучения на качество прогнозирования в гостиничном бизнесе
В работе представлено исследование по прогнозированию пользовательских предпочтений при бронировании отелей на основе открытых данных платформы онлайн-бронирования. Разработаны и оценены три модели машинного обучения (регрессионная, кластеризация K-средних и классификация K-ближайших соседей), реализованные на Python с использованием библиотек Pandas и Scikit-learn.
Введение
В современном гостиничном бизнесе онлайн-платформы для бронирования генерируют огромные объемы данных о поведении потенциальных клиентов. Интеллектуальный анализ этой информации позволяет не только лучше понимать предпочтения пользователей, но и создавать системы для персонализированных рекомендаций [1]. Ключевым аспектом становится оценка информативности различных показателей и их влияния на прогностическую способность моделей.
Крупнейшие игроки рынка, такие как Expedia, активно инвестируют в развитие алгоритмов машинного обучения для улучшения пользовательского опыта. В рамках конкурсов на платформе Kaggle компании предоставляют открытые наборы данных, что создает уникальные возможности для исследования интеллектуальных показателей и разработки новых подходов к прогнозированию потребительского выбора.
Актуальность данного исследования обусловлена необходимостью применения современных методов Data Science для извлечения полезной информации из больших данных и построения моделей, способных прогнозировать пользовательский выбор. Классические подходы часто не учитывают сложную структуру и нелинейные зависимости в данных, что требует использования более глубоких методов анализа и моделирования [2].
Целью работы является исследование интеллектуальных показателей прогнозирования бронирований отелей путем проведения полного цикла анализа данных: от разведочного анализа и предобработки до построения и оценки нескольких типов моделей машинного обучения (регрессии, кластеризации и классификации).
<...>
Ключевые слова: прогнозирование бронирований, интеллектуальный анализ данных, машинное обучение, Python, Pandas, регрессия, кластеризация, K-средних
Полную версию статьи читайте в журнале Подпишитесь на журнал
Facebook
Мой мир
Вконтакте
Одноклассники
Google+
|