Обучить модель детекции аномалий

Описание
Блок позволяет обучить модель детекции аномалий.
Для этого необходимо выбрать один из алгоритмов из выпадающего списка, а также указать путь к файлу с данными для обучения, используемую колонку, долю выбросов (по умолчанию задано значение 0,1), количество параллельных задач (по умолчанию задано значение 2) и путь для сохранения модели.
Блок имеет 2 выпадающих меню. Клик по символу раскрывающегося списка открывает следующее меню:
- Выполнить обучение:
- Локально;
- На удаленном сервере;
- Алгоритм:
- LocalOutlierFactor - популярный метод выявления выбросов в машинном обучении. Он работает путем измерения локального отклонения плотности данных относительно их соседей. Алгоритм присваивает каждому экземпляру оценку аномалии, где экземпляры с значительно более низкой плотностью по сравнению с их соседями считаются выбросами;
- IsolationForest - проводится случайное разбиение пространства признаков, такое, что изолированные точки отсекаются от нормальных кластеризованных данных. Окончательный результат усредняется по нескольким запускам стохастического алгоритма. Алгоритм распознает аномалии различных видов: как изолированной точки с низкой локальной плотностью, так и кластеры аномалий малых размеров.

Пример использования
В данном примере на основе xlsx-файла осуществляется обучение модели детекции аномалий. Результат сохраняется в файл anomaly_detection.

В данном примере на основе xlsx-файла осуществляется обучение модели детекции аномалий на удаленном сервере. ID полученной модели сохраняется в файл anomaly_detection_id.
- Параметр “Сохранить идентификатор модели в” не является обязательным.

Данные в файле:

Результат
Файл с обученной моделью на диске:

Информация о созданной модели на сервере:
