Преимущества визуальной формы представления информации

Методы мысленного отображения и визуального представления часто являются основой стратегии ориентирования при интерпретации карты. Некоторым это дается легко, другим труднее, хотя с опытом навыки улучшаются. Описание картины в виде написанного текста, связанное с определенным видом спорта, часто используется, чтобы помочь участникам создать яркий образ. Это позволяет им построить соответствующие преодолевающие стратегии для потенциально трудных ситуаций окружающей среды. Описание местности часто используется в ориентировании как часть технической тренировки. Например, тренер или другой человек просит, чтобы oриентировщик представил, а затем устно описал местоположение КП или основные ориентиры маленького участка карты. Местоположение КП на вершине холмика, который имеет маленькие болота к северо-востоку и юго-западу. Длинный отрог тянется на запад, а меньшие холмики расположены к северо-востоку, востоку и юго-западу. На котором холмике стоит КП? Аналогично ориентировщик мог бы выслушать описание маленького участка карты или местоположения КП, а затем попробовать воспроизвести устное описание: Холм в виде сосиски имеет две вершины, по одной в каждом конце узкого горного хребта, расположенного в восточно-западном направлении. Горный хребет имеет два холмика, создающих седловину на равном расстоянии от вершин. К северо-западу от седловины круто спускается долина. Восточная вершина выше, чем западная и имеет крутой склон на востоке, большой широкий отрог, убегающий на север и пологий склон на юге. Западная вершина имеет пологий склон на севере и западе и длинный тонкий отрог, лежащий к югу. Оба эти способа помогают развить визуальное представление. Навыки визуального представления фундаментальны для ориентирования. Способность представить местоположение КП или определенную область карты должна улучшиться с опытом. Практика, однако, не должна ограничиваться тренировкой или участием в соревнованиях. Существуют другие возможности для практики, как в помещении, так и на улице. Например, постепенное изучение карт знакомых и незнакомых областей и затем визуальное представление местоположения КП, основанное на информации карты, может предшествовать фактическому посещению местности. Очень часто во время обсуждения местоположения КП или участка карты можно услышать от ориентировщика "это не было то, что я ожидал". Другой способ, используемый некоторыми oриентировщиками, заключается в том, чтобы, тренируясь на знакомом ландшафте, работать с картой другой территории и на бегу пытаться представить характерные черты незнакомого ландшафта. Это может показаться довольно причудливым, но это очень хорошее упражнение на концентрацию.

Решетневскуе чтения. 2014

сти к инновационной деятельности, так как для коррекции стиля требуется больше времени.

2. Для повышения результативности тренинга по развитию психологической готовности педагога к инновационной деятельности целесообразно формировать группы с учетом индивидуальных стилей деятельности педагогов.

3. Наилучшим продолжением проведенных тренингов могло бы стать посттренинговое сопровождение в формате дистанционного курса.

Полученные результаты могут быть использованы как база для разработки программы по формированию

или повышению уровня психологической готовности педагогов к инновационной деятельности, а также для развития индивидуального стиля деятельности как условия инновационной подготовки педагога.

Таким образом, гипотеза исследования о наличии взаимосвязи между психологической готовностью педагога к инновационной деятельности и стилем педагогической деятельности эмпирически подтвердилась.

© Бобкова Н. Г., Шершитский А. А., 2014

ВИЗУАЛЬНОЕ ПРЕДСТАВЛЕНИЕ ИНФОРМАЦИИ

О. В. Бразговка, О. П. Микова

Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева Российская Федерация, 660014, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31

Е-mail: [email protected]

Рассмотрены возможности визуального представления информации как наиболее удобного и доступного способа изложения инженерной мысли не только в производстве, но и в других областях.

Ключевые слова: графическое представление информации, визуализация, визуальный язык, образные представления.

VISUAL REPRESENTATION OF INFORMATION

O. V. Brazgovka, O. P. Mikova

Siberian State Aerospace University named after academician M. F. Reshetnev 31, Krasnoyarsky Rabochy Av., Krasnoyarsk, 660014, Russian Federation E-mail: [email protected]

In this statement opportunities of visualization are considered as one of the most convenient and available ways of expressing engineer ideas not only in production process, but also in other fields.

Keywords: graphic representation of information, visualization, visual language, presentative imagination.

Большинство знаний, с которыми сталкивается современный человек, носит вербальный характер. Самым распространенным способом сохранения и передачи информации является текст, который, как правило, читается последовательно от начала к концу - линейное средство коммуникации. Однако в методологии научного познания появляется интерес к визуализированному виду знания и представления информации структурированной в виде графов, схем, графиков, диаграмм. При переводе информации из текстовой формы в графическую форму графика должна служить «резонансом» понимания проблемы, способствовать генерации гипотез, идей и целей. Роль визуализации информации в образовании становится особенно актуальной, так как помогает обобщить и запомнить изучаемый материал, а также способствует более длительному сохранению его в памяти и быстрому его воспроизведению при необходимости. В некотором роде структурно-логические схемы, гра-

фики, графы выступают в роли промежуточного звена между внешним линейным содержанием (текст учебника) и внутренним нелинейным содержанием (в сознании). Наглядные образы сокращают словесные рассуждения и уплотняют информацию.

Существует наглядная, броская, понятная всем с детства, форма представления информации - это графика. Графический способ подачи информации употреблялся человеком на протяжении тысячелетий задолго до изобретения письменности. Это были сначала наскальные рисунки, пиктографическое письмо, затем миниатюры с технической тематикой, по которым можно установить способ производства тех или иных предметов и чертежи-рисунки, дававшие лишь ориентировочные представления об очертаниях предмета. Чертежи и схемы используются для решения геометрических задач более трех тасячелетий.

Как и другие языки, визуальный язык имеет свои собственные ресурсы и возможности, характерные

Инновационные образовательные технологии в вузе

именно для него - словарь элементов формы, грамматику пространственной организации, идиомы объемной перспективы и синтаксис фразировки образов. В изобразительном искусстве визуальный язык часто является самоцелью, определяя собой ценность всего произведения, а графическая подача информации должна вызывать эмоции у зрителя. В прикладной сфере, в частности в технических чертежах и в промышленном искусстве, его применение ограничивается требованиями производства и графические средства подачи информации (чертежи, схемы, таблицы, графики, диаграммы) предназначены только для передачи технической информации. Для научно-технической графики требуется, прежде всего, не эстетическое воздействие, а ясность передаваемой идеи.

В результате научно-технического прогресса, когда усложняются технические устройства, возрастает потребность в более эффективных средствах передачи информации. Для этих целей мобилизуются возможности графического языка и возможности создания 3Б моделей средствами компьютерной графики.

Однако намного чаще информация отображается без использования эффективных графических средств. Существуют технические тексты, которые недостаточно схватывать в целом, а необходимо запоминать очень точно, чтобы затем в практической работе неукоснительно руководствоваться ими. Это, например, различные инструкции по эксплуатации, ремонту, наладке оборудования. Дополненные графическими изображениями инструкции или определения могли бы способствовать лучшему пониманию.

Значение визуальных, в том числе графических, образов особенно велико для людей с преобладающим наглядно-образным типом мышления.

Искусствовед и психолог Р. Арнхейм утверждает, что никакую информацию о предмете не удастся непосредственно передать читателю, если не представить этот предмет в разборчивой форме, в виде грамотно построенных чертежей и рисунков.

Один из крупнейших специалистов по психологии зрения, профессор Р. Л. Грегори в своей книге «Разумный глаз» говорит, что «понимать» - значит видеть вещи определенным образом, но нельзя «видеть» не понимая.

Средства графического представления информации применяются в самых различных областях визуальной коммуникации от иллюстрации технической книги и картографии до инструкций по сборке конструкций или использованию разнообразной техники. Во всех этих областях главное - это вызвать определенные процессы мышления, опирающиеся на образы, а рисунок является именно тем средством, с помощью которого «графическая мысль» передается в виде «графического высказывания». Причем графическое высказывание не требует перевода на разные языки и широко используется во многих инструкциях по сборке, эксплуатации, ремонту и т. д.

Графики могут использоваться на начальном этапе исследования для изучения сути проблемы, анализа исходных данных, а также на завершающей стадии исследования для представления полученных результатов в удобной, наглядной форме

Овладение техникой визуализации научно-технической информации, умение представить ее в виде ясного простого рисунка имеют большое значение и для ученого, готовящего отчет, пишущего книгу или диссертацию, и для инженера, отстаивающего свои оригинальные технические идеи.

Образные представления выполняют в научной и педагогической деятельности ряд важнейших функций - обобщение, синтез разнородной информации, является необходимостью для понимания, умения выразить суть незнакомого через знакомое. В этом аспекте их можно рассматривать в качестве необходимого компонента языка науки.

1. Арнхейм Р. Новые очерки по психологии искусства / пер. с англ. М. : Прометей, 1994. 352 с.

2. Грегори Р. Л. Разумный глаз. М., 1972.

3. Кириллин В. А. Страницы истории науки и техники. М. : Наука, 1994. 350 с.

4. Кравченко А. Ф. История науки и техники. Новосибирск: Изд-во СО РАН, 2005. 435 с.

5. Ломов Б. Ф. Вопросы общей, педагогической и инженерной психологии. М. : Педагогика, 1991. 296 с.

6. Макарова Е. А. Визуализация как интроекция смыслообразов в ментальное пространство личности: монография. М. : Спутник+, 2010. 170 с.

7. Монахов Д. Н. Визуализация информации: генезис, проблемы, тенденции: монография. М. : МАКС-Пресс, 2012. 56 с.

8. Плотинский Ю. М. Визуализация информации. М. : Изд-во МГУ, 1994. 64 с.

9. Сафронова Л. В., Рахматуллин Т. Р. Визуализация научного знания: дидактический аспект: монография. Уфа: Уфимский юридический институт МВД России, 2008. 127 с.

1. Arnheim Р. Novyeocherki po psihologii iskusstva. 1994. 352 s.

2. Gregori R. L. Razymnyi glaz. М., 1972.

3. Kirillin V. A. Кириллин В. А. Stranicy istorii nauki I tekhniki. М. : Nauka (Science), 1994. 350 s.

4. Kravchenko A. F. Istoriya nauki I tekhniki. Novosibirsk, 2005. 435 s.

5. Lomov B. F. Voprosy obschei, pedagogicheskoi I ingenernoy psikhologii. М., 1991. 296 s.

6. Makarova E. A. Visualizacia kak introekcia smysloobrazov v mantalnoye prostranstvo lichnosti. М., 2010. 170 s.

7. Monahov D. N. Visualizaciya informacii: genesis, problem, tendencii. М. : MAKS Press, 2012. 56 s.

8. Plotinskiy Y. M. Visualizaciya informacii. М. : MGY, 1994. 64 s.

9. Safronova L. V., Rahmatullin T. R. Visualizaciya nauchnogo znaniya: didacticheskiy aspect. Ufa: Yfimskiy yuridicheskiy instityt MVD Rossii, 2008. 127 s.

10. William J. Bowman. Graphic communication. John Wiley & Sons, New York - London - Sydney, 1968. 218 p.

© Бразговка О. В., Микова О. П., 2014

"Говорят, один рисунок стоит тысячи слов, и это действительно так, но при условии, что рисунок хороший." Боумена

С возрастанием количества накапливаемых данных, даже при использовании сколь угодно мощных и разносторонних алгоритмов Data Mining, становится все сложнее "переваривать" и интерпретировать полученные результаты. А, как известно, одно из положений Data Mining - поиск практически полезных закономерностей. Закономерность может стать практически полезной, только если ее можно осмыслить и понять.

В 1987 году по инициативе ACM SIGGRAPH IEEE Computer Society Technical Committee of Computer Graphics, в связи с необходимостью использования новых методов, средств и технологий данных, были сформулированы соответствующие задачи направления визуализации.

К способам визуального или графического представления данных относят графики, диаграммы, таблицы, отчеты, списки, структурные схемы, карты и т.д.

Визуализация традиционно рассматривалась как вспомогательное средство при анализе данных, однако сейчас все больше исследований говорит о ее самостоятельной роли.

Традиционные методы визуализации могут находить следующее применение:

представлять пользователю информацию в наглядном виде;

компактно описывать закономерности, присущие исходному набору данных;

снижать размерность или сжимать информацию;

восстанавливать пробелы в наборе данных;

находить шумы и выбросы в наборе данных.

Визуализация инструментов Data Mining

Каждый из алгоритмов Data Mining использует определенный подход к визуализации. В предыдущих лекциях мы рассмотрели ряд методов Data Mining. В ходе использования каждого из методов, а точнее, его программной реализации, мы получали некие визуализаторы, при помощи которых нам удавалось интерпретировать результаты, полученные в результате работы соответствующих методов и алгоритмов.

Для деревьев решений это визуализатор дерева решений, список правил, таблица сопряженности.

Для нейронных сетей в зависимости от инструмента это может быть топология сети, график изменения величины ошибки, демонстрирующий процесс обучения.

Для карт Кохонена: карты входов, выходов, другие специфические карты.

Для линейной регрессии в качестве визуализатора выступает линия регрессии.

Для кластеризации: дендрограммы, диаграммы рассеивания.

Диаграммы и графики рассеивания часто используются для оценки качества работы того или иного метода.

Все эти способы визуального представления или отображения данных могут выполнять одну из функций:

являются иллюстрацией построения модели (например, представление структуры (графа) нейронной сети);

помогают интерпретировать полученный результат;

являются средством оценки качества построенной модели;

сочетают перечисленные выше функции (дерево решений, дендрограмма).

Визуализация Data Mining моделей

Первая функция (иллюстрация построения модели), по сути, является визуализацией Data Mining модели. Существует много различных способов представления моделей, но графическое ее представление дает пользователю максимальную "ценность". Пользователь, в большинстве случаев, не является специалистом в моделировании, чаще всего он эксперт в своей предметной области. Поэтому модель Data Mining должна быть представлена на наиболее естественном для него языке или, хотя бы, содержать минимальное количество различных математических и технических элементов.

Таким образом, доступность является одной из основных характеристик модели Data Mining. Несмотря на это, существует и такой распространенный и наиболее простой способ представления модели, как "черный ящик". В этом случае пользователь не понимает поведения той модели, которой пользуется. Однако, несмотря на непонимание, он получает результат - выявленные закономерности. Классическим примером такой модели является модель нейронной сети.

Другой способ представления модели - представление ее в интуитивном, понятном виде. В этом случае пользователь действительно может понимать то, что происходит "внутри" модели. Таким образом, можно обеспечить его непосредственное участие в процессе.

Такие модели обеспечивают пользователю возможность обсуждать ее логику с коллегами, клиентами и другими пользователями, или объяснять ее.

Понимание модели ведет к пониманию ее содержания. В результате понимания возрастает доверие к модели. Классическим примером является дерево решений. Построенное дерево решений действительно улучшает понимание модели, т.е. используемого инструмента Data Mining.

Кроме понимания, такие модели обеспечивают пользователя возможностью взаимодействовать с моделью, задавать ей вопросы и получать ответы. Примером такого взаимодействия является средство "что, если". При помощи диалога "системапользователь" пользователь может получить понимание модели.

Теперь перейдем к функциям, которые помогают интерпретировать и оценить результаты построения Data Mining моделей. Это всевозможные графики, диаграммы, таблицы, списки и т.д.

Примерами средств визуализации, при помощи которых можно оценить качество модели, являются диаграмма рассеивания, таблица сопряженности, график изменения величины ошибки.

Диаграмма рассеивания представляет собой график отклонения значений, прогнозируемых при помощи модели, от реальных. Эти диаграммы используют для непрерывных величин. Визуальная оценка качества построенной модели возможна только по окончанию процесса построения модели.

Таблица сопряженности используется для оценки результатов классификации. Такие таблицы применяются для различных методов классификации. Они уже использовались нами в предыдущих лекциях. Оценка качества построенной модели возможно только по окончанию процесса построения модели.

График изменения величины ошибки . График демонстрирует изменение величины ошибки в процессе работы модели. Например, в процессе работы нейронных сетей пользователь может наблюдать за изменением ошибки на обучающем и тестовом множествах и остановить обучение для недопущения "переобучения" сети. Здесь оценка качества модели и его изменения может оцениваться непосредственно в процессе построения модели.

Примерами средств визуализации, которые помогают интерпретировать результат, являются: линия тренда в линейной регрессии, карты Кохонена, диаграмма рассеивания в кластерном анализе.

Методы визуализации

Методы визуализации, в зависимости от количества используемых измерений, принято классифицировать на две группы :

представление данных в одном, двух и трех измерениях;

представление данных в четырех и более измерениях.

Представление данных в одном, двух и трех измерениях

К этой группе методов относятся хорошо известные способы отображения информации, которые доступны для восприятия человеческим воображением. Практически любой современный инструмент Data Mining включает способы визуального представления из этой группы.

В соответствии с количеством измерений представления это могут быть следующие способы:

одномерное (univariate) измерение, или 1-D;

двумерное (bivariate) измерение, или 2-D;

трехмерное или проекционное (projection) измерение, или 3-D.

Следует заметить, что наиболее естественно человеческий глаз воспринимает двухмерные представления информации.

При использовании двух- и трехмерного представления информации пользователь имеет возможность увидеть закономерности набора данных:

его кластерную структуру и распределение объектов на классы (например, на диаграмме рассеивания);

топологические особенности;

наличие трендов;

информацию о взаимном расположении данных;

существование других зависимостей, присущих исследуемому набору данных.

Если набор данных имеет более трех измерений, то возможны такие варианты:

использование многомерных методов представления информации (они рассмотрены ниже);

снижение размерности до одно-, двухили трехмерного представления. Существуют различные способы снижения размерности, один из них - факторный анализ - был рассмотрен в одной из предыдущих лекций. Для снижения размерности и одновременного визуального представления информации на двумерной карте используются самоорганизующиеся карты Кохонена.

Представление данных в 4 + измерениях

Представления информации в четырехмерном и более измерениях недоступны для человеческого восприятия. Однако разработаны специальные методы для возможности отображения и восприятия человеком такой информации.

Наиболее известные способы многомерного представления информации:

параллельные координаты;

∙ "лица Чернова";

лепестковые диаграммы.

Параллельные координаты

В параллельных координатах переменные кодируются по горизонтали, вертикальная линия определяет значение переменной. Пример набора данных, представленного в декартовых координатах и параллельных координатах, дан на рис. 16.1 . Этот метод представления многомерных данных был изобретен Альфредом Инселбергом (Alfred Inselberg) в 1985 году.

Медицинские исследователи установили , что если в инструкции к лекарству находится только текст, человек усваивает из нее лишь 70% информации. Если же в инструкцию добавить картинки, человек усвоит уже 95%.

В нашей компании уже много лет занимаются разработкой и поддержкой инструментов для визуализации данных, охватывая большой диапазон платформ и технологий. И в этом есть смысл, ведь визуализационные инструменты всегда были и остаются востребованными на рынке разработки. И мы знаем, в чем причина такой популярности.

Что такое визуализация данных?

Прежде всего, нужно знать, что же такое визуализация данных и какие ее методы используются, в том числе и в повседневной жизни.


Самые простые, а потому и самые распространенные методы визуализации - это графики

Визуализация данных - это наглядное представление массивов различной информации. Существует несколько типов визуализации :

  • Обычное визуальное представление количественной информации в схематической форме. К этой группе можно отнести всем известные круговые и линейные диаграммы, гистограммы и спектрограммы, таблицы и различные точечные графики.
  • Данные при визуализации могут быть преобразованы в форму, усиливающую восприятие и анализ этой информации. Например, карта и полярный график, временная линия и график с параллельными осями, диаграмма Эйлера.
  • Концептуальная визуализация позволяет разрабатывать сложные концепции, идеи и планы с помощью концептуальных карт, диаграмм Ганта, графов с минимальным путем и других подобных видов диаграмм.
  • Стратегическая визуализация переводит в визуальную форму различные данные об аспектах работы организаций. Это всевозможные диаграммы производительности, жизненного цикла и графики структур организаций.
  • Графически организовать структурную информацию с помощью пирамид, деревьев и карт данных поможет метафорическая визуализация, ярким примером которой является карта метро.
  • Комбинированная визуализация позволяет объединить несколько сложных графиков в одну схему, как в карте с прогнозом погоды.

Зачем использовать визуализацию данных?

Визуальная информация лучше воспринимается и позволяет быстро и эффективно донести до зрителя собственные мысли и идеи. Физиологически, восприятие визуальной информации является основной для человека. Есть многочисленные исследования, подтверждающие, что:
  • 90% информации человек воспринимает через зрение
  • 70% сенсорных рецепторов находятся в глазах
  • около половины нейронов головного мозга человека задействованы в обработке визуальной информации
  • на 19% меньше при работе с визуальными данными используется когнитивная функция мозга, отвечающая за обработку и анализ информации
  • на 17% выше производительность человека, работающего с визуальной информацией
  • на 4,5% лучше воспоминаются подробные детали визуальной информации


Если попросить читателя вспомнить названия материков, в голове возникнет именно эта картинка
  • в 60000 раз быстрее воспринимается визуальная информация по сравнению с текстовой


На графике читатель быстрее найдет минимальное и максимальное значения
  • 10% человек запоминает из услышанного, 20% - из прочитанного, и 80% - из увиденного и сделанного
  • на 323% лучше человек выполняет инструкцию, если она содержит иллюстрации


Инструкцию снизу намного легче и быстрее понять и выполнить

Подробнее о фактах и исследованиях можно посмотреть в интересной инфографике .

Очевидно, что человек предрасположен обрабатывать именно визуальную информацию. Помимо прекрасной обработки нашим мозгом, визуализация данных имеет несколько преимуществ:

  • Акцентирование внимания на разных аспектах данных


С помощью графиков можно легко обратить внимание читателя на красные показатели
  • Анализ большого набора данных со сложной структурой
  • Уменьшение информационной перегрузки человека и удерживание его внимания
  • Однозначность и ясность выводимых данных
  • Выделение взаимосвязей и отношений, содержащихся в информации


На графике легко можно заметить важные данные
  • Эстетическая привлекательность


Эстетически привлекательные графики делают подачу данных эффектной и запоминающейся

Эдвард Тафти , автор одних из лучших книг по визуализации, описывает ее как инструмент для показа данных; побуждения зрителя задуматься о сути, а не методологии; избежания искажения того, что должны сказать данные; отображения многих чисел на небольшом пространстве; показа большого набора данных связным и единым целым; побуждения зрителя сравнивать фрагменты данных; служения достаточно четким целям: описанию, исследованию, упорядочиванию или украшению (“The Visual Display of Quantitative Information”, Edward Tufte).

Как правильно использовать визуализацию данных?

Успех визуализации напрямую зависит от правильности ее применения, а именно от выбора типа графика, его верного использования и оформления.


60% успеха визуализации зависит от выбора типа графика, 30% - от его правильного использования и 10% - от его верного оформления

Правильный тип графика

График позволяет выразить идею, которую несут данные, наиболее полно и точно, поэтому очень важно выбрать подходящий тип диаграммы. Выбор можно осуществить по алгоритму:

Цели визуализации - это реализация основной идеи информации, это то, ради чего нужно показать выбранные данные, какого эффекта нужно добиться - выявления отношений в информации, показа распределения данных, композиции или сравнения данных.


В первом ряду показаны графики с целями показа отношений на данных и распределения данных, а во втором ряду целями являются показ композиции и сравнения данных

Отношения в данных - это то, как они зависят друг от друга, связь между ними. С помощью отношений можно выявить наличие или отсутствие зависимостей между переменными. Если основная идея информации содержит фразы “относится к”, “снижается/повышается при”, то нужно стремиться показать именно отношения в данных.
Распределение данных - то, как они располагаются относительно чего-либо, сколько объектов попадает в определенные последовательные области числовых значений. Основная идея при этом будет содержать фразы “в диапазоне от x до y”, “концентрация”, “частотность”, “распределение”.
Композиция данных - объединение данных с целью анализа общей картины в целом, сравнения компонентов, составляющих процент от некоего целого. Ключевыми фразами для композиции являются “составило x%”, “доля”, “процент от целого”.
Сравнение данных - объединение данных, с целью сравнения некоторых показателей, выявление того, как объекты соотносятся друг с другом. Также это сравнение компонентов, изменяющихся с течением времени. Ключевые фразы для идеи при сравнении - “больше/меньше чем”, “равно”, “изменяется”, “повышается/понижается”.

После определения цели визуализации требуется определить тип данных. Они могут по своему типу и структуре быть очень разнородными, но в самом простом случае выделяют непрерывные числовые и временные данные, дискретные данные, географические и логические данные. Непрерывные числовые данные содержат в себе информацию зависимости одной числовой величины от другой, например графики функций, такой как y=2x. Непрерывные временные содержат в себе данные о событиях, происходящих на каком-либо промежутке времени, как график температуры, измеряемой каждый день. Дискретные данные могут содержать в себе зависимости категорийных величин, например график количества продаж товаров в разных магазинах. Географические данные содержат в себе различную информацию, связанную с местоположением, геологией и другими географическими показателями, яркий пример - это обычная географическая карта. Логические данные показывают логическое расположение компонентов относительно друг друга, например генеалогическое древо семьи.


Графики непрерывных числовых и временных данных, дискретных данных, географических и логических данных

В зависимости от цели и данных можно выбрать наиболее подходящий им график. Лучше всего избегать разнообразия ради разнообразия и выбирать по принципу “чем проще, тем лучше”. Только для специфичных данных использовать специфичные типы диаграмм, в остальных же случаях хорошо подойдут самые распространенные графики:

  • линейный (line)
  • с областями (area)
  • колонки и гистограммы (bar)
  • круговая диаграмма (pie, doughnut)
  • полярный график (radar)
  • точечный график (scatter, bubble)
  • карты (map)
  • деревья (tree, mental map, tree map)
  • временные диаграммы (time line, gantt, waterfall).
Линейные диаграммы, графики с областями и гистограммы могут содержать в одном аргументе для одной категории несколько значений, которые могут быть как абсолютными (тогда к таким видам графикам прибавляется приставка stacked), так и относительными (full stacked).


График со stacked значениями и с full stacked

При выборе подходящего графика можно руководствоваться следующей таблицей, составленной на основе этой диаграммы и книги “Говори на языке диаграмм” Джина Желязны:

Правильное использование графика

Важно не только верно выбрать тип графика, но и правильно его использовать:
  • Не нужно нагружать график большим количеством информации. Оптимальное количество разных типов данных, категорий - это не более 4-5, иначе же целесообразнее разделить такую диаграмму на несколько штук.


Такой график можно сравнить со спагетти и лучше разделить на несколько диаграмм
  • Верно выбрать шкалу и ее масштаб для графика. Для гистограмм и графиков с областями предпочтительнее начинать шкалу значений с нуля. Постараться не использовать инвертированные шкалы - это очень часто вводит зрителя в заблуждение относительно данных.


Неверная шкала отрицательно влияет на восприятие данных. В первом случае некорректно выбран масштаб, во втором шкала инвертирована
  • Для круговых диаграмм и графиков, где показан процент от общей доли, сумма значений всегда должна составлять 100%.
  • Для лучшего восприятия данных информацию на оси лучше упорядочить - либо по значениям, либо по алфавиту, либо по логическому смыслу

Правильное оформление графика

Ничто так не радует глаз, как правильно оформленные графики, и ничто так не портит диаграммы, как наличие графического “мусора”. Основные принципы оформления:
  • использовать палитры похожих, не ярких цветов, и постараться ограничиться набором из шести штук
  • вспомогательные и второстепенные линии должны быть простыми и не бросающимися в глаза


Вспомогательные линии на графике не должны отвлекать внимание от основной идеи данных
  • там, где возможно, использовать только горизонтальные надписи на осях
  • для графиков с областями предпочтительнее использовать цвет с прозрачностью
  • для каждой категории на графике использовать свой цвет

Выводы

Визуализация - мощный инструмент донесения мыслей и идей до конечного потребителя, помощник для восприятия и анализа данных. Но как и все инструменты, ее нужно применять в свое время и в своем месте. В противном случае информация может восприниматься медленно, а то и некорректно.


На графиках изображены одни и те же данные, слева показаны основные ошибки визуализации, а справа они исправлены

При умелом применении визуализация данных позволяет сделать материал впечатляющим, нескучным и запоминающимся.

P.S. Графики для статьи были сделаны с помощью

Данная статья написана представителем компании DevExpress и опубликована в блоге на ХабраХабре.

Медицинские исследователи установили, что если в инструкции к лекарству находится только текст, человек усваивает из нее лишь 70% информации. Если же в инструкцию добавить картинки, человек усвоит уже 95%.

Очевидно, что человек предрасположен обрабатывать именно визуальную информацию. Помимо прекрасной обработки нашим мозгом, визуализация данных имеет несколько преимуществ:

  • Акцентирование внимания на разных аспектах данных


С помощью графиков можно легко обратить внимание читателя на красные показатели.

  • Анализ большого набора данных со сложной структурой
  • Уменьшение информационной перегрузки человека и удерживание его внимания
  • Однозначность и ясность выводимых данных
  • Выделение взаимосвязей и отношений, содержащихся в информации


На графике легко можно заметить важные данные.

Эстетическая привлекательность


Эстетически привлекательные графики делают подачу данных эффектной и запоминающейся.

Эдвард Тафти, автор одних из лучших книг по визуализации, описывает ее как инструмент для показа данных; побуждения зрителя задуматься о сути, а не методологии; избежания искажения того, что должны сказать данные; отображения многих чисел на небольшом пространстве; показа большого набора данных связным и единым целым; побуждения зрителя сравнивать фрагменты данных; служения достаточно четким целям: описанию, исследованию, упорядочиванию или украшению ().

Как правильно использовать визуализацию данных?

Успех визуализации напрямую зависит от правильности ее применения, а именно от выбора типа графика, его верного использования и оформления.


60% успеха визуализации зависит от выбора типа графика, 30% - от его правильного использования и 10% - от его верного оформления.

Правильный тип графика

График позволяет выразить идею, которую несут данные, наиболее полно и точно, поэтому очень важно выбрать подходящий тип диаграммы. Выбор можно осуществить по алгоритму:

Цели визуализации - это реализация основной идеи информации, это то, ради чего нужно показать выбранные данные, какого эффекта нужно добиться - выявления отношений в информации, показа распределения данных, композиции или сравнения данных.


В первом ряду показаны графики с целями показа отношений на данных и распределения данных, а во втором ряду целями являются показ композиции и сравнения данных.

Отношения в данных - это то, как они зависят друг от друга, связь между ними. С помощью отношений можно выявить наличие или отсутствие зависимостей между переменными. Если основная идея информации содержит фразы «относится к», «снижается/повышается при», то нужно стремиться показать именно отношения в данных.
Распределение данных - то, как они располагаются относительно чего-либо, сколько объектов попадает в определенные последовательные области числовых значений. Основная идея при этом будет содержать фразы «в диапазоне от x до y», «концентрация», «частотность», «распределение».

Композиция данных - объединение данных с целью анализа общей картины в целом, сравнения компонентов, составляющих процент от некоего целого. Ключевыми фразами для композиции являются «составило x%», «доля», «процент от целого».

Сравнение данных - объединение данных, с целью сравнения некоторых показателей, выявление того, как объекты соотносятся друг с другом. Также это сравнение компонентов, изменяющихся с течением времени. Ключевые фразы для идеи при сравнении - «больше/меньше чем», «равно», «изменяется», «повышается/понижается».

После определения цели визуализации требуется определить тип данных. Они могут по своему типу и структуре быть очень разнородными, но в самом простом случае выделяют непрерывные числовые и временные данные, дискретные данные, географические и логические данные. Непрерывные числовые данные содержат в себе информацию зависимости одной числовой величины от другой, например графики функций, такой как y=2x. Непрерывные временные содержат в себе данные о событиях, происходящих на каком-либо промежутке времени, как график температуры, измеряемой каждый день. Дискретные данные могут содержать в себе зависимости категорийных величин, например график количества продаж товаров в разных магазинах. Географические данные содержат в себе различную информацию, связанную с местоположением, геологией и другими географическими показателями, яркий пример - это обычная географическая карта. Логические данные показывают логическое расположение компонентов относительно друг друга, например генеалогическое древо семьи.


Графики непрерывных числовых и временных данных, дискретных данных, географических и логических данных.

В зависимости от цели и данных можно выбрать наиболее подходящий им график. Лучше всего избегать разнообразия ради разнообразия и выбирать по принципу «чем проще, тем лучше». Только для специфичных данных использовать специфичные типы диаграмм, в остальных же случаях хорошо подойдут самые распространенные графики:

  • линейный (line)
  • с областями (area)
  • колонки и гистограммы (bar)
  • круговая диаграмма (pie, doughnut)
  • полярный график (radar)
  • точечный график (scatter, bubble)
  • карты (map)
  • деревья (tree, mental map, tree map)
  • временные диаграммы (time line, gantt, waterfall).

Линейные диаграммы, графики с областями и гистограммы могут содержать в одном аргументе для одной категории несколько значений, которые могут быть как абсолютными (тогда к таким видам графикам прибавляется приставка stacked), так и относительными (full stacked).


График со stacked значениями и с full stacked

При выборе подходящего графика можно руководствоваться следующей таблицей, составленной на основе этой диаграммы и :


Правильное использование графика

Важно не только верно выбрать тип графика, но и правильно его использовать:

  • Не нужно нагружать график большим количеством информации. Оптимальное количество разных типов данных, категорий - это не более 4-5, иначе же целесообразнее разделить такую диаграмму на несколько штук.


Такой график можно сравнить со спагетти и лучше разделить на несколько диаграмм.

Верно выбрать шкалу и ее масштаб для графика. Для гистограмм и графиков с областями предпочтительнее начинать шкалу значений с нуля. Постараться не использовать инвертированные шкалы - это очень часто вводит зрителя в заблуждение относительно данных.


Неверная шкала отрицательно влияет на восприятие данных. В первом случае некорректно выбран масштаб, во втором шкала инвертирована.

  • Для круговых диаграмм и графиков, где показан процент от общей доли, сумма значений всегда должна составлять 100%.
  • Для лучшего восприятия данных информацию на оси лучше упорядочить - либо по значениям, либо по алфавиту, либо по логическому смыслу.

Правильное оформление графика

Ничто так не радует глаз, как правильно оформленные графики, и ничто так не портит диаграммы, как наличие графического «мусора». Основные принципы оформления:

  • использовать палитры похожих, не ярких цветов, и постараться ограничиться набором из шести штук
  • вспомогательные и второстепенные линии должны быть простыми и не бросающимися в глаза


Вспомогательные линии на графике не должны отвлекать внимание от основной идеи данных.

  • там, где возможно, использовать только горизонтальные надписи на осях;
  • для графиков с областями предпочтительнее использовать цвет с прозрачностью;
  • для каждой категории на графике использовать свой цвет.

Выводы

Визуализация - мощный инструмент донесения мыслей и идей до конечного потребителя, помощник для восприятия и анализа данных. Но как и все инструменты, ее нужно применять в свое время и в своем месте. В противном случае информация может восприниматься медленно, а то и некорректно.


На графиках изображены одни и те же данные, слева показаны основные ошибки визуализации, а справа они исправлены.

При умелом применении визуализация данных позволяет сделать материал впечатляющим, нескучным и запоминающимся.