Заказчик: ИП Башкирова М. Д.
Целью проекта являлась разработка программы, которая позволит заказчику оптимизировать процесс закупки товаров и, таким образом, максимизировать прибыль за счёт более точного прогнозирования спроса.
Основной задачей было спрогнозировать спрос на товары различных категорий, представленных в онлайн-магазине заказчика. На основе этого прогноза формировались рекомендации по закупке товаров на ближайшие три месяца.
Я принимал участие в проекте в сотаве команды аналитиков данных. Мы занимались анализом данных, формулировали гипотезы, подготавливали данные, обучали модели и выбирали наилучшие решения для повышения точности прогноза.
Для оценки качества прогнозирования были выбраны классические метрики регрессии: RMSE (Root Mean Square Error) и MAE (Mean Absolute Error). Дополнительно мы использовали MAPE (Mean Absolute Percentage Error), что позволяло корректно сравнивать модели, обученные на разных категориях товаров, и получать относительную оценку качества предсказаний.
Мы предположили, что спрос на товары может зависеть от сезонных факторов, включая праздничные и предшествующие им дни:
- Чёрная пятница
- Рождественские и предновогодние распродажи
- День святого Валентина и другие значимые даты
Эти дни были добавлены в модель в качестве признаков. Также мы рассмотрели возможность увеличения объёма данных за счёт привлечения внешних источников информации, таких как Яндекс.Вордстат, Google Trends и другие инструменты для анализа потребительского спроса.
На этом этапе была проведена комплексная обработка данных:
- Удаление дубликатов и обработка пропущенных значений
- Выявление и маркировка выбросов, связанных с отсутствием товара на складе
- Преобразование временных рядов для последующего анализа и обучения моделей
Специфика исторических данных заказчика заключалась в том, что в определённые периоды времени товары могли резко заканчиваться, что приводило к аномально низким значениям спроса. Эти выбросы были учтены и обработаны с целью минимизации их влияния на прогноз.
В качестве базового метода мы использовали простую сезонную модель. Она строилась на коэффициентах сезонности, рассчитанных по данным за предыдущий год. Прогноз для каждой недели формировался путём домножения значения предыдущей недели на соответствующий коэффициент сезонности.
Для прогнозирования спроса были протестированы несколько подходов:
- SARIMA – классическая статистическая модель для анализа временных рядов
- Random Forest – ансамблевый метод машинного обучения
- LSTM – рекуррентные нейронные сети, адаптированные для временных рядов
- Prophet – модель, разработанная компанией Facebook, специально для прогнозирования временных рядов с сезонностью
По результатам тестирования наилучшие результаты на большинстве товарных категорий показала модель Prophet от Facebook. Она продемонстрировала высокую точность предсказаний и гибкость в учёте сезонных факторов, что сделало её оптимальным выбором для данного проекта.
В результате проделанной работы была создана система прогнозирования, позволяющая заказчику эффективно планировать закупки на основе точных предсказаний спроса. Это позволило не только минимизировать издержки, связанные с избыточными или недостаточными закупками, но и увеличить прибыль за счёт своевременного пополнения запасов наиболее востребованных товаров.
Проект продемонстрировал важность комплексного подхода к анализу данных: начиная от выявления закономерностей в исторических данных, выбора релевантных признаков и гипотез, до выбора наилучшей модели прогнозирования.
Полученный опыт и наработанные решения могут быть адаптированы и масштабированы для других бизнесов, работающих в сфере e-commerce и ритейла, где точный прогноз спроса играет ключевую роль в стратегическом управлении запасами.