demand-hardware-failure

Проект признан лучшим в окружном хакатоне "Цифровой прорыв: Сезон Искуственный интеллект" 2024 г.

Официальный результат на странице Хакатона

Краткое описание решения

Мы разработали систему прогнозирования отказов дисков на основе машинного обучения, которая позволяет оперативно управлять запасами оборудования в ЦОД. В основе решения лежит регрессионная модель AutoML Gluon, обученная на исторических данных о дисках. Решение включает удобный интерфейс командной строки (CLI) для запуска обучения, дообучения и предсказаний, обеспечивая гибкость и адаптивность системы. Мы проводили кросс-валидацию для повышения точности модели и использовали негативное семплирование для дисков, проработавших более двух лет без отказов.

Технические особенности:

Модель: AutoML Gluon, задача регрессии.
Стратегия семплирования: Негативное семплирование для дисков, не вышедших из строя за более чем 2 года.
Генерация фичей: На основе статистических данных, собранных с дисков (среднее время работы, количество ошибок, нагрузка и т.д.).
Кросс-валидация: Использовалась для повышения стабильности и точности модели.
UI-сервис: Утилита командной строки (CLI), позволяющая запускать обучение, дообучение на новых данных и делать прогнозы по дискам.
Мониторинг и логирование: Система ведет журнал работы модели, отслеживая точность предсказаний и обновления модели.

Уникальность решения:

Интеграция кросс-валидации, негативного семплирования и автоматической генерации фичей в единую платформу с удобным интерфейсом для предсказания отказов оборудования.

Документация к CLI инструменту для обучения и предсказания моделей AutoGluon

Этот скрипт представляет собой CLI (Command Line Interface) инструмент для обучения и предсказания моделей с использованием библиотеки AutoGluon. Он позволяет пользователю выполнять три основные операции: обучение модели, предсказание результатов и комбинацию этих двух операций (обучение и предсказание).

Установка зависимостей

Перед использованием скрипта убедитесь, что у вас установлены все необходимые зависимости. Вы можете установить их с помощью pip:

pip install -r requirements.txt

Параметры и опции

file_path: (обязательный аргумент) Путь к входному файлу, который будет использоваться для обучения или предсказания.
second_file_path: (опциональный аргумент) Путь ко второму входному файлу, который используется только в случае вызова метода fit_predict.
--fit: (опция) Флаг, указывающий на необходимость вызова метода обучения модели.
--predict: (опция) Флаг, указывающий на необходимость вызова метода предсказания модели.
--fit_predict: (опция) Флаг, указывающий на необходимость вызова метода обучения и предсказания модели.
--preprocessing: (опция) Флаг, указывающий на необходимость обработки данных, подается папка с ежедневными наблюдениями.
--help: (опция) Флаг, вызов функции помощи.

Примеры использования

Обучение модели

python cli.py path/to/folder_data --preprocessing Этот пример запускает процесс обработки данных для модели, используя данные из папки path/to/folder_data, на выходе получаем computing_target_data.csv

Видео-демонстрация обработки данных

Обучение модели

python cli.py path/to/train_data.csv --fit Этот пример запускает процесс обучения модели, используя данные из файла train_data.csv. На выходе ожидается путь к файлу с сохраненными весами.

Предсказание результатов

python cli.py path/to/test_data.csv --predict Этот пример запускает процесс предсказания результатов, используя данные из файла test_data.csv. Прежде запускается локальная модель, её результат сохраняется в папку и запускает глобальную модель, её результат выводться в консоль.

Обучение и предсказание!

python cli.py path/to/train_data.csv path/to/test_data.csv --fit_predict Этот пример запускает процесс обучения и предсказания, используя данные из файлов train_data.csv и test_data.csv. Обратите внимание, что для этой операции оба пути к файлам являются обязательными.

Видео-демонстрация переобучения и прогнозирования данных

Пример прогноза локальной модели

Пример прогноза глобальной модели

Внутреннее API

Модуль stats

`iter_file(filepath: str) -> Generator[tuple[datetime, str, str, bool], None, None]`

Генерирует строки из CSV-файла

`iter_files(data_path: str) -> Generator[tuple[datetime, str, str, bool], None, None]`

Генерирует строки из папки с CSV-файлов

`get_data(folder: str = 'data') -> Generator[FailureInfo, None, None]`

Генерирует модели FailureInfo() по всем CSV-файлам в папке folder

@dataclass
class FailureInfo:
    serial_number: str
    model: str
    start_date: datetime
    failure_date: datetime

`init_sqlite3(conn)`

Инициализация SQLite3 базы данных и таблицы failure_info, содержащая четыре колонки:

serial_number - серийный номер
model - модель
start_date - дата начала работы
failure_date - дата отказа

`fill_data(conn, data_generator: Iterable[FailureInfo]) -> None`

Заполняет таблицу failure_info соответствующими сущностями

Используется как обучение или дообучение

`get_statistics_by_models(conn, percentile: float = 0.9) -> list[tuple[str, float]]`

Получает список перцентилей дней отказов по каждой модели, опираясь на таблицу failure_info

Используется как предсказание

Name		Name	Last commit message	Last commit date
Latest commit History 29 Commits
best_predict		best_predict
model		model
research		research
src		src
weights_model/ds_sub_fit/sub_fit_ho		weights_model/ds_sub_fit/sub_fit_ho
.gitattributes		.gitattributes
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
catboost_sota.py		catboost_sota.py
cli.py		cli.py
data_preprocessing.ipynb		data_preprocessing.ipynb
model_train.ipynb		model_train.ipynb
percentile_by_model.sql		percentile_by_model.sql
requirements.txt		requirements.txt
stats.py		stats.py
train_data.csv		train_data.csv

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

demand-hardware-failure

Краткое описание решения

Технические особенности:

Уникальность решения:

Документация к CLI инструменту для обучения и предсказания моделей AutoGluon

Установка зависимостей

Параметры и опции

Примеры использования

Обучение модели

Видео-демонстрация обработки данных

Обучение модели

Предсказание результатов

Обучение и предсказание!

Видео-демонстрация переобучения и прогнозирования данных

Пример прогноза локальной модели

Пример прогноза глобальной модели

Внутреннее API

Модуль stats

`iter_file(filepath: str) -> Generator[tuple[datetime, str, str, bool], None, None]`

`iter_files(data_path: str) -> Generator[tuple[datetime, str, str, bool], None, None]`

`get_data(folder: str = 'data') -> Generator[FailureInfo, None, None]`

`init_sqlite3(conn)`

`fill_data(conn, data_generator: Iterable[FailureInfo]) -> None`

`get_statistics_by_models(conn, percentile: float = 0.9) -> list[tuple[str, float]]`

About

Releases

Packages

Contributors 3

Languages

License

AGoldian/demand-hardware-failure

Folders and files

Latest commit

History

Repository files navigation

demand-hardware-failure

Краткое описание решения

Технические особенности:

Уникальность решения:

Документация к CLI инструменту для обучения и предсказания моделей AutoGluon

Установка зависимостей

Параметры и опции

Примеры использования

Обучение модели

Видео-демонстрация обработки данных

Обучение модели

Предсказание результатов

Обучение и предсказание!

Видео-демонстрация переобучения и прогнозирования данных

Пример прогноза локальной модели

Пример прогноза глобальной модели

Внутреннее API

Модуль stats

iter_file(filepath: str) -> Generator[tuple[datetime, str, str, bool], None, None]

iter_files(data_path: str) -> Generator[tuple[datetime, str, str, bool], None, None]

get_data(folder: str = 'data') -> Generator[FailureInfo, None, None]

init_sqlite3(conn)

fill_data(conn, data_generator: Iterable[FailureInfo]) -> None

get_statistics_by_models(conn, percentile: float = 0.9) -> list[tuple[str, float]]

About

Topics

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Contributors 3

Languages

`iter_file(filepath: str) -> Generator[tuple[datetime, str, str, bool], None, None]`

`iter_files(data_path: str) -> Generator[tuple[datetime, str, str, bool], None, None]`

`get_data(folder: str = 'data') -> Generator[FailureInfo, None, None]`

`init_sqlite3(conn)`

`fill_data(conn, data_generator: Iterable[FailureInfo]) -> None`

`get_statistics_by_models(conn, percentile: float = 0.9) -> list[tuple[str, float]]`

Packages