Данные, истории, инструменты: как работает дата-отдел «Новой газеты»

В связи с делом Ивана Голунова в последние дни много говорят о расследовательской журналистике в России. Мы хотим на кейсах «Новой газеты» рассказать, как работают расследователи и почему сегодня невозможно представить их работу без открытых данных.

Этой весной журналисты дата-отдела «Новой газеты» Алеся Мароховская, Ирина Долинина и Алексей Смагин выступили на Дне открытых данных и рассказали, как они работают над своими материалами, используя в основе открытые данные и алгоритмы.

— «Госзаказ и тайные холдинги»: https://goszakaz.novayagazeta.ru/, — журналисты на основе данных ЕГРЮЛ и данных о госзакупках проанализировали госконтракты крупнейших государственных компаний, госкорпораций и их дочерних структур с 2011 по 2017 гг. с помощью специально написанного программного кода. Затем результаты найденных отношений визуализировали в виде графа, чтобы наглядно видеть, кто с кем связан и, возможно, образует картели. В проекте подробно описаны скрытые холдинги компаний РЖД, Газпром и Росатом.

— «ВИП-кочевники» совместный проект с «Трансперенси Интернешнл-Россия»: https://www.novayagazeta.ru/articles/2018/09/17/77842-svoih-ne-brosaem, — в этом проекте расследователи изучали конфликт интересов и выявляли команды чиновников, которые целиком переходят из одной госструктуры в другую. Журналисты написали код, который проанализировал данные проекта «Декларатор» о 59 тыс. чиновниках. Алгоритм строился по следующему принципу: если 2 человека работали в одном и том же месте, в одно и то же время 2 раза и более, то алгоритм объединял их в команду. Далее журналисты изучали активность найденных «аномалий» в госзаказе: кому и на что отдаются многомиллиардные подряды.

—  «Кто поднимает Россию на дыбу»: https://www.novayagazeta.ru/articles/2018/10/08/78095-kto-podnimaet-rossiyu-na-dybu, — на основе данных «Росправосудия» и «СудАкта» журналисты собрали все доступные тексты приговоров (4500) с 2011 по 2017 гг., вынесенные должностным лицам за превышение своих полномочий с применением насилия (ст. 286 ч.3). Далее по найденным текстам расследователи вручную собрали статистику и узнали, какие ведомства чаще всего превышают свои полномочия по указанной статье. В их числе оказались: военнослужащие, МВД, ФСИН. Процент удовлетворения всех исков потерпевших с 2011 по 2017 гг. о компенсации морального ущерба составил 22% дел, что в сумме равно 34 млн. рублей.

Дата-журналистика Алеся Мароховская поделилась личным опытом и своим подходом к изучению программирования с нуля и работе с данными: «У меня, как у журналиста, был такой подход: я иду учиться интервьюировать данные. Данные тоже самое, что человек для журналиста. Мне нужно задать правильный вопрос к данным, нужно их собрать и правильно обработать. Для этого мне нужно программирование».

Смотрите полное видео выступления:

Презентация: https://drive.google.com/file/d/1dQS14SdCq_lB5gef6J8IWfeuDzFOL_F4/view.