Deductor Studio – аналитическое ядро платформы Deductor. Deductor Studio содержит полный набор механизмов импорта, обработки, визуализации и экспорта данных для быстрого и эффективного анализа информации.
Реализованные в Deductor Studio механизмы позволяют в рамках одного приложения пройти весь цикл анализа данных – получить информацию из произвольного источника, провести необходимую обработку (очистку, трансформацию данных, построение моделей), отобразить полученные результаты наиболее удобным образом (OLAP, таблицы, диаграммы, деревья решений…) и экспортировать результаты на сторону.
Вся работа по анализу данных в Deductor Studio базируется на выполнении следующих действий:
- Импорт данных;
- Обработка данных;
- Визуализация;
- Экспорт данных;
Все механизмы унифицированы и выполняются при помощи мастеров.
Отправной точкой для анализа всегда является процедура импорта данных. Полученный набор данных может быть обработан любым из доступных способов. Результатом обработки также является набор данных, который в свою очередь опять может быть обработан. Результаты обработки можно просмотреть множеством способов и экспортировать. Последовательность действий, которые необходимо провести для анализа данных является сценарием, который можно автоматически выполнять на любых данных.
Типовой сценарий обработки, например, для задачи прогнозирования выглядит следующим образом:
В Deductor Studio используются самые мощные технологии, такие как многомерный анализ, нейронные сети, деревья решений, самоорганизующиеся карты, спектральный анализ и множество других. При этом акцент сделан на самообучающиеся методы и машинное обучение, что позволяет строить адаптивные системы, т.е. способные реагировать на изменение ситуации. Использование самообучающихся методов и мастеров для настройки, позволяет снизить требование к подготовке персонала, делая современные технологии доступными широкому кругу пользователей.
Для того, чтобы начать анализ, необходимо получить табличные данные из стороннего источника. Природа источника данных значения не имеет. Deductor Studio поддерживает множество источников данных: хранилище данных Deductor Warehouse, промышленные СУБД, текстовые файлы, офисные приложения, 1C:Предприятие, ADO и ODBC источники и прочее. Использование Deductor Warehouse и виртуального хранилища данных как источника данных обеспечивает дополнительную функциональность, благодаря реализации мощного семантического слоя. Полный список поддерживаемых источников данных – импорт данных
Следующим шагом является, собственно, обработка данных. Под обработкой подразумевается любое действие, связанное с преобразованием данных, например, построение моделей или очистка. Механизмы обработки можно комбинировать произвольным образом. Доступны следующие: нейронные сети, деревья решений, самоорганизующиеся карты, ассоциативные правила, линейная регрессия, очистка данных (редактирование аномалий, заполнение пропусков, спектральный анализ), трансформация данных (преобразование дат, скользящее окно, дискретизация) и множество других. Полный список механизмов обработки – процесс обработки данных
Просмотреть результаты можно при помощи механизмов визуализации. Визуализировать можно любой объект в сценарии обработки. Программа самостоятельно анализирует, каким образом можно отобразить информацию, пользователь должен только выбрать нужный вариант – OLAP кубы (кросс-таблица, кросс-диаграмма), плоская таблица, диаграмма, гистограмма, статистика, анализ по принципу 'что-если', граф нейросети, иерархическая система правил, карты и прочее… Полный список способов отображения – визуализация данных
Завершающим шагом в сценарии обработки чаще всего является экспорт данных. Результаты обработки можно на любом шаге обработки экспортировать для последующего использования в других программах, например, учетных системах. Поддерживается множество форматов: хранилище данных Deductor Warehouse, Microsoft Excel, Microsoft Word, HTML, XML, Dbase, текстовой файл с разделителями и прочее… Полный список приемников данных – экспорт данных
Объединение всех описанных выше механизмов в рамках единой программы, обеспечивает принципиально новое качество – уменьшается время создания законченных решений, упрощается интеграция с другими приложениями, увеличивается производительность. Все это сочетается с гибкостью и простотой использования. Наличие большого набора инструментов позволяет, начав с небольших подзадач, постепенно наращивать возможности, двигаясь к созданию системы поддержки принятия решений на уровне предприятия.