Немного о продвинутых визуализаторах: плоское дерево

Сегодня BI-инструменты становятся все проще, а визуализаторы все сложнее. О том, как правильно использовать продвинутую визуализацию, и в каких случаях от неё лучше отказаться, читайте в нашей новой серии статей по визуализации.

Инструменты для визуального анализа данных (или Visual Discovery) пользуются огромным успехом. Помимо прочего, конечные пользователи получили возможность использовать не только простые, но и «сложные», продвинутые виды визуализации, такие как пузырьковая диаграмма или плоское дерево. Продвинутые визуализаторы привлекают пользователя своим непривычным и необычным видом, они притягивают к себе взгляд. Но использовать подобные компоненты просто ради красивой картинки не имеет никакого смысла, если теряется аналитическая составляющая.

Как и для любых видов графиков и диаграмм, у продвинутых визуализаторов есть свои специфические свойства: в одних задачах они значительно облегчат вам жизнь, в других – только осложнят.

В этой серии статей мы рассмотрим основные виды продвинутых визуализаторов, особенности их использования, примеры и часто допускаемые ошибки.

Начнем с Плоского Дерева (оно же TreeMap).

Описание

На плоском дереве данные с иерархической структурой представляются в виде вложенных друг в друга прямоугольников. Для анализа доступны два показателя: первый определяется размером прямоугольников, а второй — цветом. Таким образом, мы можем одновременно анализировать, например, объем продаж по всем точкам розничной сети и их увеличение/уменьшение по сравнению с предыдущим периодом.

Когда можно и нужно использовать

Плоское дерево очень полезно, если необходимо:

- визуализировать очень большое количество элементов одновременно;

- получить общее представление о ситуации;

- получить представление о том, как соотносятся между собой два показателя, есть ли какая-то закономерность.

Для визуализации с помощью размера выбираются количественные показатели, методом агрегации для которых является сумма (объем продаж, прибыли, количество клиентов, ВВП и т.д.). Для визуализации с помощью цвета используют показатели, характеризующие уровень эффективности и результативности или изменение показателя (доля прибыли, прирост продаж, доля некачественной продукции).

Когда использовать не стоит

Если число элементов невелико, то нет смысла строить плоское дерево. Воспользуйтесь обычной гистограммой с двумя показателями. Если показатели несопоставимы, то второй показатель можно вынести на дополнительную ось.

Гистограмма позволит точно сопоставить и сравнить значения по обоим показателям. Тогда как по цвету элемента на плоском дереве мы можем оценить только его принадлежность к той или иной группе значений.

И, наконец, примеры

Классический пример использования плоского дерева – это анализ стоимости ценных бумаг. Ценные бумаги (маленькие прямоугольники) сгруппированы по секторам экономики (крупные прямоугольники с серым заголовком). Размер прямоугольников определяет стоимость ценных бумаг. Цвет отображает изменение стоимости бумаги по отношению к предыдущему периоду: если цвет ближе к красному спектру, то цена падает, к зеленому – растет.

Если бы мы использовали, скажем, гистограмму, то число элементов было бы настолько велико, что ничего нельзя было бы понять.

Используя же плоское дерево, мы можем увидеть, например:

- что в текущем периоде обвалились акции, например, добывающего сектора, тогда как нефтегазовый сектор на подъеме;

- что падает/растет стоимость мелких/крупных компаний в том или ином секторе;

- самые крупные компании в каждом секторе.

Разумеется, хорошие примеры найдутся не в каждом отчете и даже не в каждой прикладной задаче. Однако их немало:

- анализ популярности веб-контента: число просмотров фильмов (по жанрам) и изменение числа просмотров;

- анализ продаж крупной розничной сети: сумма продаж по магазину (по региону) и доля прибыли;

- анализ номенклатуры продукции: число продаж в месяц (по группе продукции) и ценовая группа;

- и так далее.

Стоит сказать, что, как и любой визуализатор, плоское дерево выполняет конкретную аналитическую задачу. Не стоит пытаться проанализировать все имеющиеся данные с помощью одного визуализатора, это невозможно. Пробуйте, выбирайте, переходите от одного способа визуализации к другому (благо, современные инструменты – Prognoz Platform в их числе — позволяют делать это в несколько кликов мышкой). Как использовать другие визуализаторы, рассмотрим в следующей статье.

В заключение напомню, что применить на практике все рассмотренные типы продвинутой визуализации вы можете с помощью Prognoz Platform. Если вы не являетесь пользователем Prognoz Platform, можете воспользоваться демо-версией платформы, где возможности визуализации представлены в полном объеме.

Читайте также

Комментарии

Подробнее о политике использования персональных данных