Прогноз-М
Приложение Прогноз-М позволяет предсказывать (прогнозировать) класс объектов на основе технологии машинного обучения. В Прогноз-М используется метод машинного обучения под названием СВС (Статистически взвешенные синдромы).
Главной особенностью приложения является возможность перехода объекта из неблагоприятного класса в благоприятный, путем изменения значений значимых показателей. Также в приложении разработана система мониторинга объектов, позволяющая отслеживать и визуализировать их состояние путем замера информативных показателей.
ПРОГНОЗИРОВАНИЕ
Задача прогнозирования состоит в том, чтобы предсказать (распознать) класс объекта или объектов. В основе прогноза лежит модель, обученная на данных ранее известных объектов. Модель является системой вычисленных микропараметров метода СВС. Распознающий алгоритм метода, получая на вход модель и данные неизвестного объекта (который не участвовал в обучении данной модели) способен предсказать класс данного объекта.
Объекты для распознавания можно получить тремя способами:
- Загрузить объекты из обучающей выборки;
- Создать новые объекты путем ввода данных вручную;
- Загрузить объекты из файла, который соответствует формату (и внутреннему представлению данных) текущей задачи и её модели.
МОНИТОРИНГ ОБЪЕКТОВ
Система мониторинга представляет собой набор средств для просмотра и сравнения данных спрогнозированных объектов между собой. Также их можно сравнить с объектами из обучающей выборки.
Визуализация данных объектов в виде стандартных точечных диаграмм позволяет видеть относительное расположение между ними и другими объектами из обучающей выборки. Грамотное использование системы позволяет видеть и понимать нюансы между объектами, а также видеть взаимозависимость между данными объекта и спрогнозированным классом, который получил объект.
В главном окне мониторинга представлена точечная диаграмма объектов, входящих в обучающую выборку (Рис. 1). Диаграммы бывают двух типов: одномерные и двумерные. Одномерная диаграмма разделена на два квадранта вертикальной границей синего цвета, проходящей по оси X. Двумерная диаграмма разделена на четыре квадранта двумя границами: вертикальной по оси X и горизонтальной по оси Y. Обозначение квадрантов в двумерной диаграмме следующее: вверху слева – первый квадрант (Рис. 1-I), вверху справа – второй квадрант (Рис. 1-II), внизу справа – третий квадрант (Рис. 1-III), внизу слева – четвертый квадрант (Рис. 1-IV).
Внизу окна справа расположена таблица показателей (Рис. 1-1), в которой можно выбрать отображаемые на диаграмме показатели. Внизу диаграммы расположена информация об объектах, отображенных на диаграмме (Рис. 1-2), в том числе р-значение по оси X и по оси Y, если выбранная диаграмма является двумерной (как на рисунке). Правая верхняя часть окна является динамической областью и меняется в зависимости от того какой инструмент визуализации выбран (Рис. 1-3). На рисунке 1 выбран инструмент "ROC-кривая".
Объекты обучающей выборки имеют характерные признаки. Первый класс представлен крестиками, второй - кружками.
Объекты прогнозирования
Объекты прогнозирования отображаются значками с характерными свойствами. Значки имеют разную форму и основной тип окраски. Объект прогнозирования первого класса имеет квадратную форму, внутри окрашенную красным цветом, а объект прогнозирования второго класса – круглую форму, внутри окрашенную зеленым цветом. Настройки формы и цвета значков для объектов прогнозирования изменить нельзя. На диаграмме объекты прогнозирования первого класса обозначены буквой Б, а объекты прогнозирования второго класса - буквой А (Рис. 1).
На рисунке 1 в динамической области выбрана ROC-кривая, на которой отображены значки спрогнозированных объектов. Каждый значок находится на присущем ему месте. Буквы А и Б на ROC-кривой соответствуют буквам А и Б на диаграмме (Рис. 1).
Вывод объектов из группы риска
Для открытия окна для вывода объектов из группы риска следует выбрать команду "Вывод объектов из группы риска" в главном меню окна мониторинга (Рис. 2).
Поскольку прогнозирование тесно связано с попаданием объекта в тот или иной квадрант, где плотность того или иного класса различается, то можно видеть, что есть квадранты с преобладанием первого класса, а есть квадранты с преобладанием второго класса.
Если прогнозируемый объект попал в первый класс, это означает попадание в группу риска. То есть для него спрогнозирован негативный сценарий.
Задача выхода из группы риска состоит в том, чтобы через изменение значений модифицируемых показателей продвинуть прогнозируемый объект из квадранта с преобладанием первого класса, в квадрант с преобладанием второго класса.
На рисунке 3 изображены два квадранта, в одном из которых находится прогнозируемый объект (Рис. 3-1), который выбирается в таблице справа (Рис. 3-2). Если значок объекта красный, значит ему спрогнозирован первый класс. Если значок объекта зеленый, значит ему спрогнозирован второй класс. Таблица с выбором показателей (Рис. 3-3) содержит только те показатели, которые являются модифицируемыми и по которым объект попал в квадрант с преобладанием в нем объектов первого (неблагоприятного) класса. В одномерной диаграмме содержится только два квадранта, в одном из которых преобладает первый класс (Рис. 3-4), а в другом – второй (Рис. 3-5).
Прогнозируемый объект здесь всегда находится в неблагоприятном квадранте. Зеленая стрелка, идущая от объекта, указывает направление на благоприятный квадрант. Под схемой указано относительное расстояние до границы (Рис. 3-6). Это означает, что необходимо изменить значение этого показателя для этого объекта на эту величину с небольшим запасом, чтобы объект перешел из неблагоприятного квадранта в благоприятный, в котором преобладают объекты второго класса. Также указан показатель, по которому построена схема (Рис. 3-7).
Выбирая различные показатели из таблицы (Рис. 3-3) можно просмотреть расстояние до границ с благоприятным квадрантом для каждого показателя.
В двумерной диаграмме четыре квадранта (Рис. 4). Главным отличием от одномерной диаграммы является возможность выбора перехода по одному из двух направлений (Рис. 4).
В двумерной диаграмме возможны случаи, когда благоприятный квадрант только один и находится он по диагонали от объекта (Рис. 5).
В этом случае для перемещения объекта в благоприятный квадрант следует изменять значения двух показателей.
Если объект попал во второй класс, то в целом ему дан благоприятный прогноз. Однако возможно существуют показатели, по которым он находится в неблагоприятном квадранте (Рис. 6).
Создание отчета
В окне мониторинга можно создать подробный отчет для каждого объекта прогнозирования. Для этого необходимо выбрать пункт меню "Создать отчет" (Рис. 2), после нажатия на который откроется окно формирования отчета (Рис. 7). Прежде всего нужно решить, какие объекты прогнозирования следует включить в отчет. Для этого каждый объект нужно отметить галкой в таблице с объектами (Рис. 7-1). Затем отметить дополнительные опции галкой, если это необходимо для отчета (Рис. 7-2). После завершения настройки формирования отчета, необходимо нажать на кнопку "Создать отчет" (Рис. 7-3).
При включении в отчет таблицы с выводом обектов из группы риска все действия по формированию такой таблицы происходят автоматически. Если для каких-то объектов такая таблица не может быть вычислена, то результаты просто не добавятся в отчет, при этом прерывания при создании отчета не произойдет. В отчет добавится вся возможная информация.