Журналистика данных (дата-журналистика) – это направление в журналистике, в основе которого лежит обработка данных и последующее представление полученной из них информации в виде текстовой истории или инфографики.

Безусловно, журналистика всегда предполагала обращение к данным, в том числе к базам данных. Однако журналистика данных как особое направление начала формироваться примерно в середине 2000-х годов. Этому способствовали два фактора:

  1. распространение компьютеров и программного обеспечения, позволяющих быстро и относительно легко обрабатывать существенные объемы данных;
  2. появление в интернете большого количества самых разных машиночитаемых данных. Прежде всего, речь идет об открытых данных.

В результате данные всё больше стали восприниматься и использоваться не как вспомогательный источник цифр, дополняющих информационное сообщение, а как основной источник, из которого можно черпать сюжеты для историй. Это могут быть истории, основанные на сопоставлении тех или иных показателей, например, в социальной сфере, или расследования с выявлением противоречий и неувязок в разных наборах данных. Также это могут быть просветительские материалы, помогающие людям разобраться в устройстве тех или иных процессов (в частности, государственных) и принимать более информированные решения.

Классический пример журналистики данных – это Datablog при британской газете Guardian, основанный в 2006 г. журналистом Саймоном Роджерсом (Simon Rogers), а теперь регулярно обновляемый множеством разных авторов.

Рост популярности дата-журналистики обусловлен еще и тем, что с распространением блогов и соцсетей информационная монополия СМИ разрушилась, и их аудитория стала сокращаться. Специализация на дата-журналистике, требующей особых навыков извлечения информации и зачастую существенных временных затрат, позволяет журналистам становиться посредниками между базами данных и широкой аудиторией. Иными словами, начала образовываться новая ниша, в которой работа журналистов востребована.

Помимо наиболее общего термина «журналистика данных» (data journalism или data driven journalism), используются и другие примыкающие понятия, призванные конкретизировать применение данных или разграничить разные способы их использования в журналистике. Однако в ряде случаев они могут использоваться синонимически.

Вычислительная журналистика (computational journalism). В отличие от дата-журналистики, акцент не столько на представлении данных в понятном для читателя виде, сколько на применении вычислительных методов для извлечения неочевидной информации из данных.

Журналистика баз данных (database journalism). В отличие от дата-журналистики, фокус этой работы приходится на создание баз данных по тем или иным темам, а не использование данных как ресурса для новостей.

Также область дата-журналистики неизбежно пересекается со сферой аналитической журналистики, с одной стороны, и расследовательской журналистики – с другой.

 

Известный британский журналист и блоггер Пол Брэдшоу (Paul Bradshaw), один из авторов «Пособия по журналистике данных» (Data Journalism Handbook) в предисловии к пособию очертил понятие журналистики данных следующим образом:

 

Что такое журналистика данных? Я мог бы просто ответить, что это журналистика, которая делается при помощи данных. Но это вряд ли поможет понять термин.

И «данные», и «журналистика» — ненадежные и неудобные термины. Кто-то считает, что данные – это любой набор цифр, чаще всего в таблице. 20 лет назад это был фактически единственный вид данных, с которыми имели дело журналисты. Но сейчас мы живем в цифровом мире – в мире, в котором практически все можно описать при помощи цифр – и в котором практически все и описывается при помощи цифр.

Ваш послужной список, 300 000 конфиденциальных документов, кто кого знает в вашем кругу друзей – все это можно описать (и все это описывается) всего двумя цифрами – нулями и единицами. Фотографии, видео, аудио – все описывается теми же двумя цифрами – нулями и единицами. Убийства, заболевания, политические голосования, коррупция и вранье – снова нули и единицы.

Что же отличает журналистику данных от остальной журналистики? Вероятно, это новые возможности, которые открываются, когда вы объединяете традиционное «чутье на новости», умение выведать все, что случилось, и способность рассказать захватывающую и наглядную историю с огромным количеством разнообразной цифровой информации, которая теперь стала доступной.

И эти возможности могут применяться на любом этапе журналистской работы. Например, это может быть использование программирования для автоматизации сбора и комбинирования информации из гражданских источников — в том числе, от муниципалитетов и полиции, как сделал Эдриан Холовати (Adrian Holovaty) сначала в проекте ChicagoCrime, затем – в проекте EveryBlock.

Или с помощью программного обеспечения можно проследить связи между сотнями тысяч документов, как это сделало издание Telegraph в проекте по расходам парламентариев (MPs’ Expenses).

Журналистика данных может помочь журналисту рассказать сложную историю с помощью инфографики. Ханс Рослинг (Hans Rosling), к примеру, в своих замечательных выступлениях рассказывал о визуализации нищеты в мире при помощи Gapminder. Видеозаписи этих его выступлений собрали миллионы просмотров по всему миру. А популярная работа Дэвида Маккендлесса (David McCandless) по извлечению сути из больших чисел – как, например, представление данных о государственных расходах в контексте или исследование о том, какое загрязнение окружающей среды произошло и какое было предотвращено, во время извержения исландского вулкана, - демонстрирует важность ясного дизайна на портале Information is Beautiful.

Или же она может помочь объяснить, какое отношение тот или иной сюжет имеет к индивидууму. Этим сейчас уже на постоянной основе занимаются BBC и Financial Times в своих интерактивных проектах по бюджету (там можно узнать, каким образом бюджет влияет на жизнь конкретного читателя, а не обобщенного обывателя). Или она может сформировать новую процедуру сбора новостей. Это успешно делает Guardian, которая в своем проекте Datablog делится с читателями данными, контекстами и вопросами.

Данные могут служить для дата-журналистики источником, или они могут быть тем инструментом, при помощи которого рассказывается история – или же они могут быть и тем, и другим одновременно. Как к любому источнику, к этому нужно относиться скептически; и, как в случае с любым инструментом, мы должны понимать, как этот инструмент может оформлять или ограничить истории, которые создаются с его помощью.