Перейти к содержимому

Обучить модель детекции аномалий

картинка_0

Описание

Блок позволяет обучить модель детекции аномалий.

Для этого необходимо выбрать один из алгоритмов из выпадающего списка, а также указать путь к файлу с данными для обучения, используемую колонку, долю выбросов (по умолчанию задано значение 0,1), количество параллельных задач (по умолчанию задано значение 2) и путь для сохранения модели.

Блок имеет 2 выпадающих меню. Клик по символу раскрывающегося списка открывает следующее меню:

  • Выполнить обучение:
    • Локально;
    • На удаленном сервере;
  • Алгоритм:
    • LocalOutlierFactor - популярный метод выявления выбросов в машинном обучении. Он работает путем измерения локального отклонения плотности данных относительно их соседей. Алгоритм присваивает каждому экземпляру оценку аномалии, где экземпляры с значительно более низкой плотностью по сравнению с их соседями считаются выбросами;
    • IsolationForest - проводится случайное разбиение пространства признаков, такое, что изолированные точки отсекаются от нормальных кластеризованных данных. Окончательный результат усредняется по нескольким запускам стохастического алгоритма. Алгоритм распознает аномалии различных видов: как изолированной точки с низкой локальной плотностью, так и кластеры аномалий малых размеров.
картинка_1

Пример использования

В данном примере на основе xlsx-файла осуществляется обучение модели детекции аномалий. Результат сохраняется в файл anomaly_detection.

картинка_2

В данном примере на основе xlsx-файла осуществляется обучение модели детекции аномалий на удаленном сервере. ID полученной модели сохраняется в файл anomaly_detection_id.

  • Параметр “Сохранить идентификатор модели в” не является обязательным.
картинка_6

Данные в файле:

картинка_3

Результат

Файл с обученной моделью на диске:

картинка_4

Информация о созданной модели на сервере:

картинка_7