Импорт данных на раз-два-три

Блог Форсайт
Одним из основных трендов на рынке бизнес-аналитики сегодня является рост популярности инструментов, ориентированных на конечного пользователя. Это явление получило название self-service BI или, по-русски говоря, бизнес-аналитика для самостоятельного использования. Суть концепции во всестороннем упрощении инструментов до уровня, который позволит пользователям анализировать данные без привлечения IT-специалистов. BI-инструменты для самостоятельного анализа предполагают наличие средств самостоятельного импорта. Поэтому в «Форсайт. Аналитической платформе» этим инструментам уделено особое внимание. Как правило, конечный пользователь не умеет или не может работать с исходными данными в корпоративном хранилище. Зато у него практически всегда есть, документ Excel с данными, которые нужно проанализировать, скажем, «к завтрашнему совещанию». Сделать это максимально быстро и эффективно позволят как раз инструменты self-service BI. А чтобы данные в этот инструмент попали, помимо простых средств анализа необходимы простые средства импорта данных.

Можно попроще?

В традиционном (упрощенном) варианте для анализа данных с помощью BI-инструмента необходимо пройти несколько этапов:
  • импорт данных или прямое подключение к источнику;
  • создание на базе таблиц многомерных источников (кубов);
  • собственно, анализ.
Для рядового пользователя создание многомерных структур – это, мягко говоря, сложная задача. Поэтому мы ее автоматизировали. Пользователь просто проходит по нескольким страницам мастера импорта и настраивает вид загружаемых данных, а куб создается автоматически. На выходе пользователь получает готовую для анализа структуру данных, которую можно сразу же использовать для создания отчетов, аналитических панелей и т.д. Важно, что работа с мастером импорта не требует от пользователя понимания многомерной модели данных. Если структура данных простая, то завершить импорт можно уже на первой странице мастера после выбора загружаемого файла (в этом случае используются настройки по умолчанию).

А поконкретнее?

Кросс-таблицы Простота – это, конечно, хорошо. Но что делать, если в загружаемом файле данные представлены в более сложном виде? Ведь на самом деле практически никто не пользуется таблицами, в которых все данные расположены по столбцам. Это стандартный формат для выгрузки статистических данных, но если файл уже подвергался аналитической обработке или выгружался из аналитической системы, то часть измерений может быть расположена по строкам (например, наименования и группы товаров) и одно-два по столбцам (например, даты). Мастер импорта в «Форсайт. Аналитической платформе» позволяет пользователю загружать и те, и другие виды файлов. При этом для настройки нужно поставить одну-единственную галочку. Иерархические измерения Нередко бывает, что в шапке загружаемой таблицы расположено иерархическое измерение (например, географическое измерение типа континент -> страна -> город) или несколько измерений. Также бывает, что пользователь хочет объединить несколько измерений в единую иерархию. Мастер импорта позволяет создавать подобные структуры еще до загрузки данных. Пользователь просто объединяет наименования измерений из источника в группы, на основе которых платформа создает иерархические структуры. Автоматическое распознавание типов данных Еще одним приятным нововведением в мастере импорта является функция автоматического распознавания типов данных. Это значит, что пользователю не придется совершать лишние механические движения, указывающие, что «в этом столбце у меня даты, а в этом — строки». Платформа сама распознает такие типы данных, как строковый, целый, вещественный, дата и др. За пользователем при этом остается право скорректировать типы по своему усмотрению.

Добавим немного разнообразия

Мастер импорта платформы – это довольно универсальный инструмент. - Во-первых, он доступен как в настольном, так и в веб-приложении. - Во-вторых, он позволяет загружать данные не только из файлов xls и xlsx, но и из файлов других «плоских» форматов. Также мастер позволяет импортировать данные из внешних СУБД (требует настройки подключения) и из уже существующих источников репозитория. - В-третьих, если пользователь продвинутый или просто знаком с организацией репозитория, в котором работает, то возможна загрузка данных в уже существующий источник или в новый источник на базе существующих справочников данных.

И пара дополнительных бонусов

Как уже было отмечено, после завершения работы мастера импорта можно сразу же приступить к анализу, а если мастер запускался из какого-то пользовательского инструмента, скажем, из аналитических запросов, то источник сразу же открывается в этом инструменте. Есть еще несколько «бонусов», которые отличают «Форсайт. Аналитическую платформу» от обычных инструментов data discovery. В процессе импорта платформа формирует все структурные компоненты: таблицы, справочники, кубы, которые сохраняются в репозитории. Это значит, что они не только доступны для повторного использования, но их также можно отредактировать, задать на уровне кубов настройки агрегации или вычислимые факты и реализовать многие другие полезные штуки, которыми при желании могут «побаловаться» более продвинутые пользователи. Если вы мало знакомы с архитектурой «Форсайт. Аналитической платформы», то стоит дополнительно отметить, что все инструменты платформы работают с одними и теми же типами источников данных. То есть создаваемые в процессе импорта многомерные кубы пользователь сможет использовать как при построении, например, регламентных отчетов или аналитических панелей, так и, скажем, в блоке моделирования и прогнозирования. Таким образом, мастер импорта позволяет загружать в платформу данные с простой и сложной структурой даже при отсутствии у пользователей специальной подготовки. При этом все многомерные структуры создаются автоматически, сохраняются в репозитории и доступны для дальнейшего использования или модификации.

Комментарии

Email не будет опубликован.
Подробнее о политике использования персональных данных