Визуализация данных – это представление информации с помощью изображений, графиков, схем, таблиц и диаграмм. Ценность визуализации в том, что она часто позволяет наиболее наглядно и лаконично выявить и показать содержащуюся в данных информацию, потому что на картинке можно сразу продемонстрировать то, что в вербальном эквиваленте займет не один абзац.

Благодаря распространению и быстрому развитию информационных технологий появилось множество инструментов для создания разного рода визуализаций. В результате представление данных в визуальном формате стало всё чаще использоваться во многих областях деятельности, прежде всего в научной, медийной и бизнес-аналитике.

В разработке способов визуального представления данных в равной мере принимают участие ИТ-специалисты и дизайнеры, так как от дизайна во многом зависит, насколько понятной и «читаемой» будет визуализация.

С помощью визуализации данных решаются самые разные задачи.

Во-первых, это важный инструмент на начальных этапах анализа данных. Самые простые графики позволяют быстро обнаружить в данных закономерности, тенденции или аномалии, на которые будет ориентироваться аналитик при дальнейшей работе с данными. Аналогичным образом журналист, используя графики при первичном просмотре данных, может сформулировать для себя вопросы, из которых в дальнейшем можно вывести сюжет для очередного материала.

Во-вторых, визуализации часто играют важную роль в представлении конечных результатов анализа. Это могут быть статичные графики, иллюстрирующие тенденции; интерактивные визуализации, позволяющие пользователям самостоятельно исследовать данные; а также инфографика (статическая или интерактивная), наглядным образом представляющая основанную на данных историю.

Важная задача визуализации в том, чтобы в одной картинке с ограниченным числом физических измерений (как правило, двухмерной) показать множество содержащихся в данных измерений и взаимосвязь между ними. Классическим примером многомерной инфографики считается старинная диаграмма, демонстрирующая наступление наполеоновской армии на Москву и последующее отступление. Эту диаграмму создал французский аналитик Шарль Минар (Charles Minard) в 1863 г. Она отражает такие параметры, как маршрут армии, направление ее движения, изменение температурных условий, а также изменение размеров армии во ходе наступления и отступления. Таким образом, принципы создания сложных визуализаций начали осваиваться еще задолго до возникновения компьютеров, однако цифровые технологии дали этому формату сильнейший стимул к развитию и распространению.

Было разработано множество инструментов для визуализации данных. Среди них есть платные и бесплатные, онлайн-приложения и скачиваемые программы, простые пользовательские, не требующие специальных навыков, и сложные, для работы с которыми нужны навыки программирования. В настоящий момент среди широкой популярностью пользуются такие онлайн-сервисы, как infogr.am и plot.ly. Однако существует великое множество других, а также продолжают создаваться новые.

Разные типы данных требуют разных способов представления. К настоящему моменту разработан ряд базовых типов визуализации для различных случаев. Например, выделяются такие типы, как линейный график, график рассеивания, столбиковая диаграмма, гистограмма, лепестковая диаграмма, линия времени и многие другие. Подробнее о типах визуализации и областях их применения можно почитать здесь.

Среди основополагающих работ, описывающих принципы визуализации данных, часто ссылаются на труды Эдварда Тафти (Edward Tufte) «Наглядное отображение количественной информации» (The Visual Display of Quantitative Information) и «Представление информации» (Envisioning Information).